安徽新闻网3小时前
深度求索发布的DeepSeek-V3和DeepSeek-R1大模型,围绕高效推理和经济训练的创新算法,以较低成本实现了大语言模型的性能突破,成为今年以来AI领域的现象级热点。
DeepSeek火爆之后,会对AI领域的同行产生哪些影响?日前,科大讯飞对此作出回应。
“总体来看,DeepSeek的出现促进了大模型应用的热度,为科大讯飞等已经提前布局的企业带来了市场加快成熟的新机会。”科大讯飞表示,该公司更加有信心依托纯国产化的星火大模型底座竞争力、数据飞轮和场景创新,在大模型应用上持续深化“护城河”和差异化竞争优势。
“DeepSeek的火爆吸引了大量云服务厂商、算力企业、芯片厂商、应用端企业等产业链上下游积极参与,中国人工智能产业生态建设的速度进一步加快,人工智能的赋能价值和产业规模加速发展,对科大讯飞这样长期投入培育人工智能市场的企业有很大的综合好处。”科大讯飞称。
DeepSeek在英伟达卡上的工程化探索,对科大讯飞进一步提升国产算力基础上大模型性价比也有很好的借鉴作用。DeepSeek验证的长思维链可读化输出,有助于整个产业链降低在数据推理路径标注的投入。未来在需要复杂推理的应用领域,大模型落地过程会进一步加快。
科大讯飞表示,当前,行业众多“深水区”问题已经到了突破解决的前夜,大模型技术阶跃发展是最关键和明确的曙光。讯飞星火会坚持全国产化路线,面向行业刚需落地,底座大模型会持续对标国内外最高水平。
此外,DeepSeek的火爆,也让更多的行业客户对大模型技术和应用有了更加广泛的关注和期待。尤其是通过数据飞轮驱动的知识积累和场景创新的业务领域,如教育、医疗等领域,人工智能应用的规模化落地会进一步加快。
基于此,科大讯飞认为,讯飞星火当前在教育、医疗等行业都是市场占有率第一的大模型,该公司在这些领域的先发优势会得到进一步发挥,未来也会形成更稳固的行业领先优势。
具体到G端(面向政务部门)和B端(面向企业客户)业务,DeepSeek的火爆对科大讯飞影响会更为复杂。
G端上,科大讯飞称,部分 G 端客户当前对DeepSeek的技术创新和产业影响处于关注和学习阶段,短期内对正在实施的智算中心建设节奏有一定影响,但长期来看,各地政府在国产智算中心等新型基础设施建设、产业生态体系完善、拓展“AI+”新型工业化应用场景、加快数智化治理转型等方面,投入会进一步加大,这些对讯飞的G端业务都会带来好处。
在以国企为代表的B端企业市场,由于DeepSeek开源免费,一些企业在AI落地项目中对大模型底座建设的投入会更加谨慎。但也有越来越多的企业在应用AI构建行业专属大模型方面的需求被激活。在与国企的合作上,讯飞在人工智能企业应用落地中的自主可控优势以及专属模型训练工具链、场景落地能力的优势,有可能会促使其业务收入规模性增长。
“DeepSeek的横空出世,将吸引国产算力厂商投入更大资源支持国产大模型的适配,有利于国内人工智能产业链更好发展。”科大讯飞称,在DeepSeek获得越来越多产业资源、政府资源支持时,一批原先以通用大模型为目标的创业公司和互联网公司将会因为无法获得足够的资源支撑而退出角逐,转做特定方向的人工智能应用落地,这有助于国内人工智能产业资源的合理分布。
科大讯飞认为,大模型对算力的需求为训练和推理两个方面,而训练实现的难度远大于推理。目前仍只有讯飞星火一家是训练和推理均在国产算力上进行的,并且仅用1万张910B国产算力卡,“科大讯飞做了大量国产算力平台上的无人区适配和效率优化,追求国产算力的极致效率,这更需要技术实力和战略勇气”。
值得注意的是,科大讯飞透露,正在训练的星火X1新版本预计在3月内完成。新版本有信心实现数学答题和过程思维链能力全面对标甚至超过世界一流同行。
“DeepSeek的火爆进一步表明通用人工智能前所未有的创新活力和发展潜力,通用大模型的天花板仍然在被持续打开,我们会坚定不移地持续投入大模型底座研发,不断输出最新成果。”科大讯飞称。
(本报记者 许昊杰)
奔流新闻线索报料方式
热线:13893646444(微信同号)
拍客:710060272@qq.com