安徽日报客户端5小时前
诺贝尔奖得主杰弗里·辛顿在上海WAIC 2025
7月26日,一段中国外交部原副部长傅莹和诺贝尔奖得主、“深度学习教父”杰弗里·辛顿(Geoffrey Hinton)关于AI的对话在网络走红。记者获悉,两个人交谈中的“AI”,就来自于安徽——由科大讯飞研发的“语音同传技术”。
01/
傅莹和Geoffrey Hinton说了什么?
在这段对话里,傅莹和辛顿握手后展开了一段关于“同传”的对话:
傅莹:杰弗里,今天你的演讲我听得非常清楚,屏幕上有实时中文翻译字幕,AI一直在翻译你的话。
杰弗里·辛顿:我看不到屏幕上(的中文实时翻译),但我耳机里听到的是人工翻译。
傅莹:所以,AI在聆听你。(AI is listening to you!)
杰弗里·辛顿(笑):也许吧。
记者获悉,傅莹和杰弗里·辛顿的交谈发生在7月26日召开的上海WAIC 2025(世界人工智能大会)现场,诺贝尔奖得主、“深度学习教父”杰弗里·辛顿(Geoffrey Hinton)教授在上海WAIC 现场分享他对人工智能安全伦理的深刻洞察。
2024 年诺贝尔物理学奖授予了约翰·霍普菲尔德(John J. Hopfield)和图灵奖得主、AI教父杰弗里·辛顿(Geoffrey E. Hinton),"以表彰他们利用人工神经网络进行机器学习的奠基性发现和发明"。
而这段对谈就发生在主论坛结束之后,杰弗里·辛顿走出会场,恰好碰到傅莹。
此外,两个人交谈中的“AI”,就来自于安徽——由科大讯飞研发的“语音同传技术”。讯飞同传产品经理张辉告诉记者,该技术正服务于上海WAIC 2025(世界人工智能大会)的3场主论坛和19场分论坛,可覆盖15种语言。
02/
谁在倾听Geoffrey Hinton?
张辉称,讯飞的“语音同传技术”在应用上表现为两种。第一种是语音同传成字幕,另一种是语音同传成语音,“杰弗里·辛顿所在的主论坛,使用的是第一种语音同传技术(将杰弗里·辛顿的英文语音同传成中文字幕)。”
也就是说,杰弗里·辛顿的感觉并没有错:他在主论坛的演讲同传成字幕,但语音同传仍然使用的是人工。
而傅莹的“一语双关”也很巧妙:AI在将杰弗里·辛顿的演讲翻译成中文字幕的同时,也在认真“倾听”杰弗里·辛顿。
在傅莹和杰弗里·辛顿对谈的前一天,基于国产算力训练的讯飞星火X1升级版刚刚上线。张辉告诉记者,上海WAIC 2025(世界人工智能大会)现场使用的语音同传技术正是使用了星火同传大模型端到端翻译技术。
*测试集合来源:测试集合是根据讯飞翻译机、讯飞同传等真实业务场景随机采样构建的测试集;测试指标为翻译综合质量得分(分值0~100分)
张辉提到,杰弗里·辛顿的演讲之所以被“清楚的翻译”,可能主要基于两点。
“以英文同传中文为例,简单来说,之前的语音同传要经历语音识别(将英文语音识别为英文文本)-机器翻译(将英文文本翻译成中文文本)-语音合成(将中文文本合成中文语音)三个阶段,但使用大模型端到端技术后,一步到位,直接从英文语音到中文语音。”
这使得整个同传系统效率更高、延迟更短、错误率更低。
张辉特别提到“首字响应速度的突破”。“过去使用翻译工具,总需要等对方说完半句话才开始翻译,现在中英同传首字响应快至2秒,已达到人类高阶同传的行业标准线。”
另一方面,杰弗里·辛顿在上海的演讲涉及到AI发展历程、知识传播特点、以及人类如何应对威胁,专业度很高。“而新版大模型恰恰在教育、医疗、企业应用、代码、科研等行业大模型和智能体上取得了新的进步,覆盖超8万垂直领域专业词汇,这使得‘语音同传’也能够相应胜任更复杂行业的场景和任务。”
03/
Geoffrey Hinton背后的AI翻译为什么是讯飞?
十几年前,杰弗里·辛顿的预言,只有科大讯飞和谷歌相信了。
2008年,学者邓力和杰弗里·辛顿的合作拉开序幕,他们一起用一种新的方法处理语音问题,而且取得了不错的结果。这种新方法就是后来颠覆AI领域的“深度学习”。
但邓力和辛顿的新方法并不被业界和学界接受。就连邓力在微软的老板——曾任卡内基梅隆大学计算机系系主任的Peter Lee都不支持他,认为辛顿的方法“非常荒谬”。一直到2012年,邓力在向微软研究院资深研究者及公司高管讲述深度学习进展时,依然被一位学者打断:“神经网络从未取得成功。”
2010年9月21日,受中科大信息科学技术学院院长李卫平邀请,邓力回到合肥,他和俞栋一起在科大西区电三楼西侧的一间会议室内作了一个关于“深度学习”的学术报告。
供职于科大讯飞研究院的一群年轻人参与了那场学术报告。这使得科大讯飞成为除微软总部之外,首先详细了解这一研究并着手跟进深度学习研究的团队之一。
邓力后来说:在深度学习刚刚被提出时,全世界只有两家公司真的相信了。“其中一家是谷歌,另一家就是科大讯飞。”
2011年,科大讯飞上线中文语音识别深度学习系统,这是第一个中文DNN语音识别系统,领先百度一个身位。到2012年底,邓力和辛顿合作的那篇近代语音识别历史上被引用最多(超过11000次)的文章《Deep neural networks for acoustic modeling in speech recognition: The shared views of four research groups》发表后,深度学习在语音识别领域全面开花,势不可挡。
谷歌后来花费了4400万美元收购了多伦多大学的一家初创公司 DNNResearch。这家公司在当时不仅没有任何产品,也压根没有生产产品的计划。它只有三位员工杰弗里·辛顿与他的学生亚历克斯·克里泽夫斯基(Alex Krizhevsky)、伊尔亚·苏茨克维(llya Sutskever)。
伊尔亚·苏茨克维后来离开谷歌,成为Open AI的联合创始人和首席科学家,并参与主导了ChatGPT的研发。2022年的11月30日,Open AI的 ChatGPT横空出世,而科大讯飞也在一周之后开启了星火大模型的研发。
讯飞的AI同传字幕为什么能展示在杰弗里·辛顿的背后?大模型当然功不可没。在大模型时代,基于星火大模型的底座能力,科大讯飞在翻译、多语言、多语种、语音同传等技术方面持续取得突破性进展,星火大模型X1的升级,也支撑了星火同传大模型的升级。
"讯飞星火X1大模型底座多语言能力持续拓展,在7月25日升级后已支持130+语种。"张辉告诉记者。
但更重要的是久久为功,是讯飞长期在语音识别、机器翻译、文字转写领域积累出的一种综合能力的体现。
讯飞在多语种技术和应用领域的积累和探索绵延二十年。去年6月,科大讯飞作为第一完成单位的《多语种智能语音关键技术及产业化》项目获得国家科学技术进步奖一等奖;也是科大讯飞继2002年和2011年分别获得国家科学技术进步奖二等奖之后首次获得国家科学技术进步奖一等奖;更是“深度学习”引发全球人工智能浪潮以来,过去十年人工智能领域首个国家科学技术进步奖一等奖。
十几年前,杰弗里·辛顿的一篇论文点燃了“深度学习”的星火,点燃了AI波澜壮阔的征程;当他静静坐在世界人工智能大会的会场时,“深度学习”在中国已经开枝散叶,正在为这个时代提供全球共济的沟通桥梁。
杰弗里·辛顿和他背后的语音同传字幕
科创融 安徽商报 元新闻记者 梁巍
奔流新闻线索报料方式
热线:13893646444(微信同号)
拍客:benliunews@163.com