南方都市报客户端19小时前
国产AI大模型正迎来一波密集的“开源潮”。7月30日,南都湾财社记者从中兴通讯方面获悉,其宣布一次性开源11项核心技术成果,包括6个自研大模型和5个行业数据集。
在开源的6个大模型中,NTele-R1-32B-V1电信大模型是其中的焦点。该模型使用约800个经过筛选的样本进行训练,“小样本高效训练”的模式,为降低AI开发成本提供了新的可能性。中兴通讯AI研发中心负责人表示,“NTele-R1-32B-V1 是从 DeepSeek-32B-Distill训练的,实现了‘少而精’的训练效果。”目前,该数据集已同步开源,开发者可直接获取用于模型优化。
针对多模态领域,中兴通讯开源了7B和3B参数的两款模型。这两款模型通过“课程强化学习”与“拒绝样本自我改进”机制,使小参数模型获得与更大规模模型相近的推理能力。该技术路径适用于智能终端、边缘计算等计算资源受限的场景。
同步开源的5个数据集中,TFCE数据集是为电信行业AI开发设计的函数调用测评工具。据介绍,该数据集整合了中兴通讯的技术积累,包含1800余个函数和917道Python题目,覆盖了4G到6G的核心技术应用场景。
此次开源是在“焕新社区”的背景下。据悉,“焕新社区”是由国务院国资委指导、中国移动牵头运营的国家级AI开源开放平台,也是国家推动AI自主生态建设的最新举措之一,中兴通讯此次开源的项目,成为该平台收到的首批核心技术。
中兴通讯高级副总裁张万春表示,中兴将以技术开源为纽带,在模型创新、算力优化、场景落地三大领域深度参与,为中国AI自主可控体系提供支撑。
从行业来看,AI技术的竞争正从单一的模型能力比拼,延伸至涵盖软硬件适配和开发者生态的全方位竞争。开源协同,正成为构建自主技术体系的关键路径。
事实上,这股“开源潮”在近期的世界人工智能大会上表现得尤为明显。大会期间,阶跃星辰便宣布其新一代基础大模型Step-3将于7月31日向全球开源。与此同时,阿里云也在此前透露其通义千问模型开源后下载量已突破4亿次。值得注意的是,开源正与国产算力深度绑定,阶跃星辰联合华为昇腾、沐曦等近10家国产芯片企业共同发起了“模芯生态创新联盟”,旨在构建从芯片到模型的协同创新体系。
这一趋势背后,是国内大模型产业从追求“通用”到深耕“垂直”的集体转向。“通用大模型好比是大学生,知识面广但解决不了专业问题。行业现在需要的是有深厚领域知识的‘专科博士’,”一位AI行业分析师向南都湾财社记者表示,“开源电信模型和数据集,价值不在于参数大小,而在于其高度的专业性和稀缺性,这正是产业应用需要的东西。”
此外,高质量的国产开源模型生态,也被视为激活国产AI芯片产业链的关键。过去,国产AI芯片厂商在追赶英伟达时,不仅面临硬件性能的差距,更受制于CUDA生态的壁垒。
“没有好用的模型和工具链,我们的芯片就只是‘裸奔’的硬件。”一家国产AI芯片公司的技术负责人对记者坦言,“开源的这些适配好的模型,为我们提供了一个完整的测试和优化靶场,能够加速软硬件一体化的进程,这是打破国外生态垄断的必要一步。”
行业分析指出,这种由国家级平台牵引、龙头科技企业贡献核心技术的“国家队+主力队员”协同模式,正成为国内AI产业发展的新趋势。通过开源共享,可以降低创新门槛,加速技术迭代和应用落地,推动中国AI产业从“技术跟跑”向“生态领跑”进行转变,为构建自主可控的AI技术体系提供支撑。
采写:南都湾财社记者 严兆鑫
奔流新闻线索报料方式
热线:13893646444(微信同号)
拍客:benliunews@163.com