AI国家队选手:讯飞星火认知大模型已经成为国内第一

发布日期:2023-05-10 21:51:07

5月6日,讯飞星火认知大模型成果发布会在安徽合肥举行,现场实测大模型七大核心能力,并发布了汽车、教育、办公、数字员工四大行业应用成果。

作为新推出人工智能大模型,讯飞星火我带来了惊喜!特别是在教育、文本创造、多轮对话等方面的回答,确实“有点东西”;甚至有一些回答,令人拍案叫绝。官方表示,讯飞星火生成式训练模型是1+N模式,“1”是通用认知智能大模型,算法研发及高效训练底座平台,“N”是应用于教育,医疗,人际交互,办公等多个领域的专业大模型。从这段话中能看得出来,讯飞星火的特色是教育,医疗,人际交互和办公。

那备受瞩目的讯飞星火认知大模型在目前已知的AI大模型相比,实力究竟如何呢?人工智能大模型有没有官方统一的评测标准?5月9日,中文通用大模型综合性评测基准SuperCLUE正式发布为我们解开了困惑。

中文通用大模型综合性评测基准SuperCLUE主要关注以下问题:中文大模型在不同任务上的表现如何?与国际代表性模型相比,中文大模型的表现达到了何种程度?中文大模型与人类表现相比如何?包括但不限于:这些模型不同任务的效果情况、相较于国际上的代表性模型做到了什么程度、 这些模型与人类的效果对比。

SuperCLUE从三个不同的维度评价模型的能力:基础能力、专业能力和中文特性能力。其中专业能力包括中学、大学与专业考试,涵盖了从数学、物理、地理到社会科学等50多项能力。其发布的总榜单显示,GPT-4排名第一,ChatGPT排名第二,星火认知大模型紧随其后排名第三,也充分说明了星火大模型尽管和GPT还有差距,但已经是国产大模型的佼佼者。此外,资本市场也在“用脚投票”,发布会后的第一个交易日,科大讯飞股票随即涨停,正是对科大讯飞大模型技术实力的认可。

在星火大模型发布会上,科大讯飞董事长刘庆峰就向我们展示了星火认知大模型的商业落地成果。也坦言,目前大模型技术还有待攻克的缺陷,比如新知识难以及时更新、事实类问答容易“张冠李戴”,史实、传统典籍等容易“编造情节”等,但这些问题在今年会有明显的改进。此外,星火大模型才刚刚发布,现在谈对标ChatGPT也为时过早。

任何行业的开创之路都充满艰辛,挑战与机遇并存。从零开始创建,需要经历无数的困难和挫折。然而,正是这些艰难险阻,塑造了科大讯飞更加坚韧的品质,变得更加有毅力、有信心在人工智能大模型的路上一往无前。二十多年的坚持不懈,才是科大讯飞取得今日成就的关键!讯飞星火认知大模型的上线也向世界证明,中国的AI技术已经起飞!

关于 锌品科技

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注