4 月 13 日,主题为“构想焕发生机的未来社会”的日本大阪・关西世博会(以下简称“大阪世博会”)开幕。大阪世博会中国馆以“共同构建人与自然生命共同体 —— 绿色发展的未来社会”为主题,携“嫦娥五号”月壤样本、“蛟龙”号体验舱等顶尖科技成果亮相,并通过大量互动装置和数字化科技、AI 技术等让展品“活起来”、展项“动起来”,向全球展示生动靓丽的“中国名片”。
中国 AI 大模型也首秀世博舞台,科大讯飞代表中国人工智能企业展示了领先的 AI 大模型技术 —— 依托国产自主可控讯飞星火大模型,打造了支持中、日、英三语实时交互的人工智能大模型展项“AI 孙悟空”。这位精通三国语言的“数字大圣”,融合了多语种、高噪场景语音识别、多情感超拟人语音合成以及多模态交互等技术能力,为全球游客提供幽默问答和智慧导览,成为中国馆唯一大模型展项。
“孙悟空”遇上自主可控 AI 大模型:
让中国文化“活”起来
“悟空,你好!”打招呼间,只见身穿西瓜裙、手拿金箍棒的“AI 孙悟空”腾云驾雾现身于水墨云海中,以动画《大闹天宫》高还原声线说道:“俺老孙来也!”
“中国にはたくさんの美しい景色があるそうですが、紹介していただけますか?(听说中国有很多美景,你能帮我介绍一下吗?)”一位日本观众也将手机镜头对准画面问道。
话音刚落,“AI 孙悟空”迅速切换日语笑道:“この孫悟空にとっては、もちろん詳しいんだ!中国の美しい景色は数えきれないほどたくさんあるよ。万里の長城は雄大で威厳があり、まるで巨大な竜が山間に這いつくばっているようだ。杭州の西湖は柔らかく美し、四季折々の景色にそれぞれ独自のおもしろみがある。そして黄山は奇抜な松、奇妙な岩、雲の海があり、どこも素晴らしくて言葉では表現しきれないんだぞ!(那俺老孙可太懂了!中国美景多到数不过来,万里长城巍峨雄伟,像巨龙盘踞山间;杭州西湖柔美秀丽,四季景致各有风情;黄山更是有奇松、怪石、云海,每一处都妙不可言呐!)”
虚实交织的展台中央“AI 孙悟空”正通过讯飞星火大模型展现技术内核 —— 以全国产自主可控的讯飞星火大模型为基础,融合了多语种、高噪场景语音识别、多情感超拟人语音合成以及多模态交互等技术能力,跨越覆盖文字、图像、语音等多模态。在聚集众多观众的世博会现场,“AI 孙悟空”也能听清、听懂观众说的问题,生动还原孙悟空惟妙惟肖的动画角色形象和声线,以中、日、英三种语言与观众展开自由深度的交流。
当日本观众抛出:“即将去中国旅游,你有什么美食推荐?”问题时,展项中的“AI 孙悟空”猛挠头一笑道:“要说中国美食,俺老孙可有太多想推荐的了,北京烤鸭薄如蝉翼,四川火锅辣似老君炉,江南小笼包汤汁烫舌,山西刀削面耍得比俺金箍棒还溜!记得去地道的老字号品尝品尝!”
该展项由上影元联合共创,呈现上海美术电影制片厂在 20 世纪 60 年代创作的经典动画《大闹天宫》中的孙悟空形象。科大讯飞对经典形象进行技术化赋能与重构,通过形象建模、语音合成、唇形预测、图像处理等 AI 核心技术,在讯飞星火大模型的加持下,成功将领先的技术与经典动画形象结合,让每个腾云驾雾的姿态都承载着跨越甲子的文化记忆。
技术赋能下的传统文化新生,在观众请求“画一幅春江水暖鸭先知”时尤为显著。只见屏幕中的“AI 孙悟空”手指一点,“俺老孙可不会画画,但你既有求,定不叫你失望,变!”一张有古诗意境的画作快速呈现。
科大讯飞凭借“科技 + 文化”双引擎的精密咬合,赋予了“AI 孙悟空”智慧和灵魂,让其圈粉无数。科大讯飞依托讯飞星火大模型底座,以科学教育专有大模型结合讯飞 AI 科学教育与奇思妙问产品,实现类科学家自由对话、问题准确理解、海量科普知识、逻辑推理、自适应响应等能力,让“AI 孙悟空”具有了认知能力;还深入挖掘“孙悟空”的文化精髓,通过讯飞 AI 虚拟人交互平台构建了与大阪世博会紧密融合的交互式知识库,让“AI 孙悟空”不仅能够面对面与用户亲切交流、幽默解疑,还能实现即时响应的问答互动及精确无误的导览服务,让每一次互动都充满趣味与便捷。
此外,讯飞智作也为大阪世博会中国馆导览耳机提供了语音技术支持。该导览耳机集成领先的多语种语音合成技术,可为参观者提供多种男声、女声音色选择,及中文、英语、日语三语种实时切换的沉浸式讲解服务,精准适配全球游客多元化需求。
以“中国芯”走向“世界窗”:
星火多语种大模型为世界提供第二种选择
从远道而来的“AI 孙悟空”到近在身边的导览服务,大阪世博会中国馆内每个与世界的对话触点,都跳动着一颗科大讯飞的“中国芯”。
“能够以‘中国芯’走向‘世界窗’,成为中国馆唯一大模型展项,科大讯飞靠的是自主可控的 AI 硬实力。”科大讯飞东北亚研究院院长孙庆华表示。科大讯飞开发的讯飞星火大模型基于全国产化算力底座训练,实现全栈自主可控,具备文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态等七大核心能力,并持续迭代升级。
去年 10 月,讯飞星火 4.0 Turbo 发布,根据真实数据背靠背的测试,七项核心能力在中文领域全面超过 GPT-4 Turbo,代码能力和数学能力超越 GPT-4o。
今年 1 月,业界首个基于全国产算力平台训练的深度推理大模型 —— 讯飞星火 X1 发布,利用更少算力实现业界一流效果;讯飞星火 4.0 Turbo 底座升级,行业首发混域知识搜索技术;推出业界首个具备端到端语音到语音同传能力的大模型 —— 星火语音同传大模型,最快语音同传时延 5 秒以内,达到人类专家译员的水平。
3 月,讯飞星火 X1 实现再升级,在模型参数量比业界同类产品少一个数量级的情况下,数学能力全面对标 DeepSeek R1 和 OpenAI o1,在中文数学各项任务中均实现领先。讯飞星火 X1 将于近期再次升级。
作为中国人工智能“国家队”,科大讯飞凭借星火大模型在算法、算力、数据全链条的自主可控性,以及多模态交互技术超越同类产品的优势,代表中国人工智能企业在世博会上展示 AI 大模型技术,向世界递出中国人工智能的“创新名片”,让全球观众为“AI 孙悟空”感到惊叹。
在星火大模型基础之上,融入并加强了多语种能力而成的星火多语种大模型是“AI 孙悟空”精通中、日、英三语的核心支撑。目前,星火多语种大模型已实现支持中、英语外的 8 个语种,包含日语、阿拉伯语、俄语、西班牙语、法语、葡萄牙语、德语及韩语,最新版本在 M-MMLU、XStoryCloze、MGSM、FLORES 等十多项覆盖综合考试、语言理解、数学、翻译等能力的国际权威多语种相关开源榜单测试中,能力平均值超越最新的 GPT-4o 和 DeepSeek V3、R1,处于国际领先水平,给世界提供第二种选择。目前,多语种大模型已在汽车、家电、办公、翻译等领域应用。
从世博舞台到千行百业:
AI 助力中国方案出海
技术突破正在转化为产业势能。4 月 17 日,科大讯飞将在大阪世博会中国馆举办讯飞双屏翻译机 2.0 新品发布会,展示讯飞双屏翻译机 2.0 的创新功能与应用场景,解决用户的嘈杂环境下实时翻译问题,与国际专家学者、行业及媒体代表一起探索语音翻译技术助力跨语言商务沟通,为世界按下智能交互加速键。
当前,科大讯飞的人工智能技术早已在千行百业中落地生根。在教育领域,科大讯飞为全国 32 个省级行政区、5 万余所学校、1.3 亿师生提供智慧教育产品和解决方案,以人工智能助力因材施教。在医疗领域,科大讯飞为每个医生打造 AI 诊疗助理、为每个居民打造 AI 健康助手,智医助理产品已在全国 31 个省市的 680 + 个区县实现常态化应用,累计提供超 9.3 亿次 AI 辅诊建议,规范病历超 3.6 亿次。在工业领域,为全国 10 个省 20 多个地市提供基于工业感知、工业认知、工业大模型、能源大模型等工业 AI 技术的产品和解决方案,在高端装备制造业、能源行业等场景陆续打造行业示范应用等。
此外,科大讯飞还在智慧教育、智能汽车、消费者服务等多个领域布局海外业务,覆盖欧洲、亚洲、北美、中东等地区,以 AI 技术赋能中国方案的全球化实践。
在智慧教育方面,科大讯飞上线全球中文学习平台,该平台已覆盖全球 191 个国家和地区,总用户数约 1633 万人。
在汽车出海方面,中国汽车出海前 10 强企业中有 8 家和科大讯飞进行深度合作,讯飞座舱智能语音解决方案已帮助上百种车型出海 60 余个国家和地区,覆盖全球 23 种外语。
在智能硬件方面,讯飞翻译机、讯飞 AI 录音笔、讯飞词典笔等产品,已销往美国、韩国、日本、匈牙利、澳大利亚、新加坡、泰国、马来西亚、印尼、土耳其、阿联酋等国家及地区。在智能软件方面,讯飞同传已成为国际大会的标配,成功助力 COP28 (联合国气候变化框架公约大会)、金砖国家媒体高端论坛、IAA 世界广告大会等多个重要会议,为全球 50 多个国家及地区服务,支撑超 40 万场会议。
在人工智能国际生态方面,讯飞开放平台国际站的上线为全球开发者提供语音识别、语音合成、机器翻译、图文识别等人工智能服务,目前海外开发者团队数已达 49.6 万。
从世博展台的聚光灯到千行百业的生产线,科大讯飞正以自主可控的星火大模型为墨,携手全球行业伙伴一起持续深耕人工智能产业生态,书写“用人工智能建设美好世界”新篇章。
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。