这家大模型豪言半年内超越ChatGPT 全球通讯

作者/于惠如

图/全天候科技

“认知大模型成为通用人工智能的曙光，科大讯飞有信心实现‘智能涌现’。”

(资料图片仅供参考)

5月6日，科大讯飞星火认知大模型揭开神秘面纱。发布会上，科大讯飞董事长刘庆峰、科大讯飞研究院院长刘聪在现场实测了讯飞星火在七大维度上的核心能力，包括多风格多任务长文本生成、语言理解、泛领域开放式知识问答、情境式思维链逻辑推理、多题型可解析数学、多功能多语言代码，以及多模态输入和表达等。

讯飞星火认知大模型发布的同时，科大讯飞也发布了基于该大模型的教育、办公、汽车和数字员工等多个领域相关产品。

星火认知大模型始于2022年12月。彼时，科大讯飞启动“1+N”大模型技术攻关，其中，“1”代表通用认知智能大模型算法研发及高效训练方案底座平台，“N”代表大模型在教育、办公、汽车、人机交互等各个领域的落地。

“当前，在文本生成、知识问答、数学能力三大能力上，讯飞星火认知大模型已超ChatGPT。”刘庆峰在发布会上表示。

与此同时，刘庆峰还给出了讯飞星火的迭代时间表及每阶段目标：第一阶段，在6月9日，突破开放性问答，如实时问答；多轮对话能力再次升级；数学能力再上台阶。第二阶段，在8月15日，突破代码能力；多模态交互能力正式开放给客户。第三阶段：10月24日，在通用大模型领域对标ChatGPT，其中中文能力超越后者，英文能力与后者相当。

此外，据刘庆峰透露，科大讯飞还将在今年推出医疗行业大模型。

发布会现场，刘庆峰用“最强”、“已超ChatGPT”、“遥遥领先”等词形容讯飞星火认知大模型的部分能力，但他同时也承认讯飞星火仍然存在一些问题。比如：对新知识难以及时更新；事实类问答容易出现“张冠李戴”；史实、传统典籍等容易“编造情节”等。

目前，星火认知大模型已对外开放测试。

现场实测七大核心能力

与百度文心一言、阿里通议千问不同，讯飞星火没有在发布会上使用提前录好的demo版本，而是在现场实测了其七大核心能力。

从现场演示效果来看，星火认知大模型基本能够流畅完成交付的各项任务。另外，讯飞星火体现了科大讯飞的一贯强项——语音能力，它可以通过语音转文字进行问答，这也是其优势所在。

演示中，刘聪让星火认知大模型写邮件、做方案、写新闻通稿、生成英文宣传文案等文本生成功能，讯飞星火均流畅地完成了任务。

现场演示的讯飞星火的语言理解能力也在线，它理解了特定的句子和场景含义，随着问题的变化，也调整了自己的答案

在数学能力中，除了常规计算、几何、情景应用等，讯飞星火解答了复杂的计算题答案。在刘庆峰看来，数理能力一定程度代表了一个大模型的聪明程度。“讯飞星火大模型不仅在国内系统中遥遥领先，也超过了ChatGPT。”

此外，刘聪还展示了大模型面向泛领域开放式知识问答能力、逻辑推理能力与代码能力。在多模态能力方面，星火大模型能够根据关键词句生成语音、图片、视频等素材，并可生成虚拟人进行视频展示。

不过，据官方介绍，讯飞星火的多模态能力目前还在测试中，最迟8月会提供给VIP客户使用。

打通“大模型+产品”闭环生态

讯飞星火认知大模型发布的当天，科大讯飞还同时发布了基于该大模型的教育、办公、汽车和数字员工等多个领域相关产品。

以汽车为例，讯飞火星认知大模型与智慧座舱的结合，可以实现车内跨业务、跨场景人车自由交流。基于大模型的智能座舱将更自由、拟人化、更懂汽车、更开放。

在学习机中，新增talktalk功能，实现中英文对话，存量学习机可更新迭代。办公本和录音笔中，新增语篇规整、要点总结、一键成稿，存量产品也可更新使用。

基于自然语言生成业务流程和RPA，在“大模型+数字员工”应用场景，可以帮助企业员工完成大量重复性工作。

现场以公司招聘事项为例，输入指令后，系统即可自动按照事先设计的RPA脚本，操作计算机中的相应软件，实现业务流程的自动化操作并输出结果，并进行数据分析。

刘庆峰透露，上述领域外，讯飞星火认知大模型还将赋能包括医疗、城市、政法、工业等在内的更多行业，满足更多专业领域的需求，向更广阔的产业领域延伸。

据了解，首批来自36个行业的3000余家企业开发者将接入星火大模型。

测试体验

星火大模型“成色”究竟如何？全天候科技亲测了多个场景下的问题，不妨一起来看一看它回答的如何。

我们先让星火大模型介绍了自己和竞品。

很明显，简单介绍没有问题，但当主语更复杂，需要理解时，它的理解能力“不在线”。

我们又让讯飞星火展现了文字创作能力——根据要求写一首诗。

这首诗基本涵盖了端午节的要素：糯米、龙舟、艾草，还拓展了龙舟、艾草等元素的使用场景，也表达了对生活的美好祝愿。但整体而言，与其说是一首诗，它更像是一首缺少押韵、对仗、与美感的顺口溜。

随后，全天候科技针对一些时下正流行的网络“热梗”进行提问，看其是否有紧跟热点的能力。

然而，对于“特种兵”式旅游这个网络热梗，讯飞星火知道一点，但知道的不多。不过，它的“态度”很好，当我们提出错误，它能认识到自己的错误，并且道歉。

在测试过程中，全天候科技发现，讯飞星火的部分语料库并未更新至最新事件，对一些实事仍然给出错误答案。比如，当我们问“北京冬奥会自由式滑雪女子U型场地冠军是谁”时，它给出的答案是：法国选手特兰斯·勒贝克（TraceLeBerque）。不过，当我们给出正确答案后，它又立马承认自己的错误并道歉。

在数学推理能力方面，我们请讯飞星火做了几道数学题。对于第一个题，讯飞星火不仅给出了正确答案，还做了延伸。而对于第二个题，它给出了详细的解题步骤及正确答案。可以看出，它的简单数学推理能力过关。

在多模态生成方面，讯飞星火的表现也不够完美。

此前已经推出的百度文心一言、阿里通义千问等大模型均具备图片生成的能力。当我们输入“科大讯飞要开大模型发布会，请生成一张海报”时，讯飞星火认知大模型告诉我们自己无法生成图片，但是它还是给我们提供了一些信息和建议。

除了文字，讯飞星火具备在答案中融入emoji表情包能力，当我们让它用emoji表情包介绍大模型发布会时，它给出了以下答案。

最后，讯飞火星究竟如何看待自己的能力？

我们抛出了刘庆峰对其已“超越ChatGPT”的夸赞，并让它证明自己。它没有承认，并已学会了“打太极”。

标签：

猜你喜欢

这家大模型豪言半年内超越ChatGPT 全球通讯

有声小说mp3下载网_有声小说下载mp3打包下载

战神回家结婚助兴_战神回家-快看

中国城市少儿足球联赛开赛万余名运动员将参与角逐

顶风破局高端化，红豆的在线新战场-即时焦点

郑州装上“文博引擎” 五一假期20万人次走进博物馆_微动态

本地生活牌桌，快手“慢半拍” 信息

这个柠檬茶门店最多的城市，正上演一场史诗级“内卷”_当前热门

3种酒桌上会失礼的举动，虽然不起眼却容易触犯，你中招了吗？

世界观天下！理气类中成药_关于理气类中成药介绍

京东成立跨部门项目组推动大模型优化

生物信息学基础及应用电子版_生物信息学基础_观天下

建艺集团：拟向全资孙公司增资2000万元

下周河南气温波动不大局地有小雨全球微头条

“十四五”时期我国将试点建设3至5条中国文物主题游径

岸田启程前往韩国，称“希望与尹锡悦坦率交换意见”_全球短讯

菲律宾执法部门解救受害中国公民，我驻菲使馆协同开展案件办理|当前通讯

环球播报:人民币国际化稳步向前：一季度人民币跨境结算规模稳步扩大

环球热资讯！俄媒：超过10架乌方无人机试图袭击克里米亚

“从波提切利到梵高：英国国家美术馆珍藏展”闭幕日在现场_当前独家

公募基金最新关注重点来了！-重点聚焦

观焦点：今日气温持续下降，蓝天白云连刷天气将近！

天舟六号船箭组合体转运至发射区将于近日择机发射

每日看点！韩国外出就餐价格连续29个月环比上涨累计涨幅达16.8%

电风扇行业市场调研分析中国电风扇行业市场前瞻

【播资讯】巴菲特：对苹果持仓绝对没有占到投资组合的35%

癌组词四年级_癌组词|全球头条

防抱死制动系统在什么情况下可以最大-环球今热点

你敢信？索爱蓝牙音箱到手价79元，性价比超高全球观点

天猫美妆总经理：2023年将新增30款破亿新品扶持价格力

热点图片

要闻

中国煤炭工业协会：煤炭在能源安全保障中压舱石作用更突出全球视点
(记者李爱平)“2022年，我国原煤产量45 6亿吨，进口2 93亿吨，煤炭在一次能源消费占
赛尔号7k7k图鉴_7k7k小游戏赛尔号焦点
1、在右下角的商城图标上有3个黄色图标中间的点一下就可以关声音了左边的点下可以隐藏
广州一业主拆承重墙，白云区住建交通局今日作出回应全球观点
近期，广州市白云区某小区一业主私自拆除结构梁及破坏剪力墙的情况，受到了市民和媒体
本土会员店不必再造山姆或Costco
作者妮可图壹览商业疫后新常态的大环境，贯穿各圈层的性价比消费越发明显，尤其是
从瑞幸的万店计划，看中国连锁咖啡的方法论
作者张泽一图壹览商业5月1日晚，正当2 4亿游客在全国各地切身体会消费复苏之时，
3秒俱乐部不再是豪车专属上海车展必看高性能车盘点环球动态
车友们期待已久的上海车展终于在4月18日正式拉开帷幕。本届车展新车云集、看点颇多，
儿童护城河边不慎走失城管热情相助找到亲人热点评
本报讯（记者管有明）前天下午，环古城河步道城管执法人员邵丹筠、金洁辉在万年桥广场
全球快看：谊品生鲜批发部来了，曾尝试多业态
作者戈多图零售圈近日，据行业媒体《灵兽》报道，很多谊品生鲜门店门头已被改为“
【聚看点】永辉原CEO李国入职盒马，永辉超市重庆北碚吾悦广场店开业
出品壹览商业沃尔玛任命LatrieceWatkins为美国首席营销官5月6日消息，据报道，沃尔
全国首创元宇宙冰雪潮玩小镇年底将亮相华熙LIVE冰上中心
5月6日，北京五棵松文化体育中心有限公司与启明迪瑞（北京）文化旅游有限公司在北京活

这家大模型豪言半年内超越ChatGPT 全球通讯

相关阅读

猜你喜欢

热点图片

要闻