蒸馏技术大幅降低开发成本 有望加速AI应用实际落地 DeepSeek通过DeepSeek-R1的输出,蒸馏了6个小模型开源给社区,其中32B和70B模型在多项能力上实现了对标OpenAI o1-mini的效果,DeepSeek-R1 API服务定价远低于OpenAI o1。更低的成本让企业在开发AI应用时,能够以、更高的效率进行,有望加速国内AI应用从概念走向实际落地。DeepSeek开源的蒸馏小模型超越OpenAI o1-mini也有望为模型加速在端侧落地。 1、思特奇300608 思特奇1月24号发布的蒸馏技术专利,意味着deekseep用了蒸馏技术,必然涉及这个专利,也就是用了思特奇的专利,可以认为双方具备合作基础了! 2、久其软件002279 久其软件:您好,公司技术团队掌握大模型蒸馏技术,但当前产品和项目中因涉及到场景的复杂性,主要应用大模型微调训练技术。未来,公司AI团队会持续跟进国内外大模型技术发展动态。感谢您的关注。 3、南威软件603636 南威软件:投资者您好!公司通过模型蒸馏技术,将DeepSeek大模型的知识高效地迁移到轻量化的小模型中,从而在保持高性能的同时,降低计算资源的需求。这种技术使得公司能够在资源受限的环境中,如边缘设备和移动终端上,高效部署人工智能模型,进一步提升在政务服务、自动化审批、数据分析、环境监测、城市治理等领域的智能化水平。目前,公司推出的深海大模型和白泽政务大模型均已接入DeepSeek 相关版本并进行私有化部署,并通过深度融合DeepSeek-R1和DeepSeek-V3等先进模型,利用模型蒸馏技术优化模型性能。感谢您对公司的关注! 4、云从科技688327 我们坚信中国人工智能企业都会不断努力,打造更优质的技术和服务。公司持续致力于通过模型蒸馏和工程优化降低模型成本,提升技术效率,提供自研模型和适配各类第三方模型(包括但不限于DeepSeek)的Agent应用及服务。云从科技始终秉持开放合作的态度,积极与行业领先企业及科研机构开展技术交流与生态协作,关于与DeepSeek具体合作进展,公司将严格遵循信息披露规范及时公告。 5、拓尔思300229 公司拓天大模型支持私有化部署,通过剪枝、量化、稀疏、蒸馏等部署优化方案,可有效降低大模型对算力资源的要求。当前拓天大模型推出的垂类大模型参数在百亿级,市场主流推理卡单卡即可满足运行要求,能够实现模型轻量化部署。 6、000997新大陆 公司基于对场景的理解能力,深入垂直场景需求通过数据蒸馏形成高质量小模型算法,并运用于垂直场景的分析和预警。截止目前,公司大模型应用已服务涵盖运营商、教育机构等领域。 7、上海钢联300226 公司希望尽快把基于 DeepSeek 的“小钢”做出来,在一季度借助 DeepSeek R1 快速蒸馏出全新的“宗师”模型,并切换“小钢”的基座模型。我 们之前基于“书生浦语”做了大量的工作,不需要做太多的重复性工作。完 成上述工作后,会跟现有“小钢”进行比较,根据测试情况,会在二季度开 放给正式用户体验。未来也可能存在其他不确定因素,敬请各位投资者关 注业务发展不及预期的风险! 4、数据服务相关的业务的变化,2025 年的资讯数据业务的展望? 答:公司 2024 年数据业务还是保持比较稳定的水平,受影响比较大的 是钢铁板块的螺纹钢业务服务,其他板块还是保持一定的增长。 |