科大讯飞星火认知大模子迭代至3.0版本,估量2024年上半年实现对标GPT4
界面新闻记者 | 于浩
10月24日,科大讯飞正式对外宣布了星火认知大模子V3.0。据科大讯飞董事长刘庆峰先容,相较于2.0版本,星火大模子V3.0在文本生成、语言领略、常识问答、逻辑推理、数学本领、代码本领、多模态本领等方面均有晋升,别离晋升了7%、6%、7%、8%、3%、9%、7%。
在5月6日,科大讯飞首次提出“1+N认知大模子”攻关项目时,曾暗示在10月24将完成通用模子对标ChatGPT,中文逾越、英文相当。
据OpenAI在官网宣布的英文任务测试集测试数据显示,星火认知大模子V3.0在48项任务中与ChatGPT功效相当;而在《通用认知智能大模子评测体系》构建测试集测试中,星火认知大模子V3.0在中文本领测评中在文本生成、语言领略等方面完成了对ChatGPT的本领逾越。
刘庆峰坦言,与GPT4对比,今朝星火在巨大常识推理、超长文本处理惩罚、跨模态的统一领略等方面尚有不小的差距。他在现场暗示,估量在2024年上半年将会宣布星火认知大模子V4.0,届时将会对标GPT4。
在现场演示环节,科大讯飞研究院院长刘聪演示了有声绘本创作助手成果,他以“小兔子去太空”为主题利用星火认知大模子V3.0现场绘制了相关绘本内容。在这一应用案例中,大模子既要担保上下文持续性,还需担保图像内容中主角的一致性,刘聪借此展示了大模子的多模态及多轮对话本领。
在V2.0宣布时,刘庆峰就曾强调多轮对话本领是星火认知大模子后续迭代的重点。此次宣布会上,刘庆峰进一步暗示,在多轮对话本领晋升的基本上,星火认知大模子V3.0可以基于数据库举办主动对话,而且进一步举办开导探究式对话。
基于这一本领,科大讯飞推出了AI人设成果,可通过特定常识进修、对话影象进修等构建起大模子人格。值得一提的是,AI人设成果支持用户自行生成大模子人格,刘聪于宣布会前搭建起自身人设,在现场将与女儿的对谈内容输入星火大模子,后者则输出了一封以刘聪口气写给女儿的信。
据先容,在以该项本领为基本的讯飞友伴上线后48小时内,有3000小我私家设产出。“主动交互本领与AI人设是将来迭代的偏向。”刘庆峰于宣布会上强调。
其次于宣布会上被强调的是代码本领。中国有约800万软件从业人员,2022年软件业务收入10.8万亿元,占GDP比重8.93%,抖客教程网,2028年预测将到达20万亿元。一方面是软件行业的辽阔市场,另一方面是吸引生态开拓者的需要,这两方面都使得代码本领成为大模子产物本领迭代的重要偏向。
据OpenAI构建的代码生成本领果真测试集HumanEval、认知智能全国重点尝试室构建的代码利用场景测试集iFLYCode-Eval测试功效显示,星火V3.0在代码本领上的表示略优于ChatGPT,但仍不及GPT4。
与刘庆峰曾多次强调的“开拓者不需要任何编程本领就可以把创意编程产物”的标语相对应,科大讯飞此次宣布了智能编程产物iFlyCode V2.0。据科大讯飞内部利用数据,本次进级的iFlyCodeV2.0可在设计阶段提效50%,编码阶段、测试阶段别离可提效37%、44%,自8月15日宣布以来该产物已在京东云、软通动力等107家机构实现对策应用。
除对外发布基座大模子的本领晋升外,此次科大讯飞还面向金融、汽车、运营商、家产、住建、物业、法令、科研文献、传媒、政务、文旅、水利等12个规模宣布了垂直行业大模子。
刘庆峰于后续群访中提及,C端应用更多的浸染在于向用户普及大模子技能,如教诲、医疗、家产、科研等规模才是今朝真正发生贸易化的刚需规模。
据Gartner数据显示,今朝全球有5%的企业在利用生成式AI,但到2026年这一比例未来到80%。“这需要一个进程,”刘庆峰表明称,讯飞会先从行业通用本领做起,而且与行业龙头企业一同做好纵深,再把应用向全行业推广。
无论是强调代码本领晋升、搭建C端应用,照旧推出垂直行业大模子,科大讯飞都揭示出了环绕星火认知大模子构建生态的野心。
从刘庆峰所披露的数据来看,星火大模子对付讯飞开拓者生态的扩展照旧起到了必然努力浸染。刘庆峰先容,与讯飞星火大模子直接相关的活泼用户数已达1200万;讯飞星火生态开拓者团队总数为552.8万,5月6日以来新增143.4万,同比增幅331%,个中有17.8万新增大模子开拓者。