正视与GPT-4的差距,讯飞星火能否扛起AI大旗?

10月24日,在程序员节的这一天,也迎来了科大讯飞刘庆峰“Flag”的兑现日。在今日举行的“全球1024开发者节”上,科大讯飞正式宣布讯飞星火认知大模型V3.0(后简称:讯飞星火V3.0)的升级,号称通用模型对标ChatGPT,实现中文超越、英文相当的水平。

从今年5月6日首次发布以来,讯飞星火至今已进行过4次重大技术迭代。9月5日凌晨,科大讯飞官宣向全民开放使用,截至目前讯飞星火认知大模型用户数突破1200万。

据科大讯飞董事长刘庆峰介绍,根据OpenAI在官网发布的英文任务测试集,讯飞星火V3.0和ChatGPT 3.5得分分别为85.1%和84.3%,目前的讯飞星火V3.0已经实现了对ChatGPT 3.5的超越。

星火V3.0号称综合能力超越ChatGPT

正视与GPT-4的差距,讯飞星火能否扛起AI大旗?

图源:科大讯飞

具体来说,讯飞星火V3.0在七大能力上均有所升级,其中文本生成提升7%,语言理解提升6%,知识问答提升7%,逻辑推理提升8%,数学能力提升3%,代码能力提升9%,多模态能力提升7%。

刘庆峰透露,在数学能力上,讯飞星火3.0已遥遥领先于ChatGPT。在设计方案生成、代码补全、测试检错等领域,讯飞星火3.0的能力也已经超越ChatGPT。

正视与GPT-4的差距,讯飞星火能否扛起AI大旗?

图源:科大讯飞

目前,AI代码开发工具iFlyCode迭代到2.0版本,可实现设计阶段、编码阶段、测试阶段分别可提效50%、37%、44%。刘庆峰表示,借助讯飞iFlyCode工具,程序员原本进行平台迁移需要3个月完成的开发工作,现在只需一个月就完成了。

此外,科大讯飞称,基于星火代码大模型的智能编程助手 iFlyCode自8月15日发布以来,已与京东云、软通动力等107家机构实现深度对接应用。在内部提效方面,根据科大讯飞内部使用数据,本次升级的iFlyCodeV2.0提效范围更广,可实现设计阶段提效50%,编码阶段、测试阶段分别可提效37%、44%。

在此次升级中,讯飞星火研究院院长刘聪还在现场展示了星火认知大模型的“AI人设”新功能,如有声绘本创作助手、友伴功能等。

正视与GPT-4的差距,讯飞星火能否扛起AI大旗?

图源:科大讯飞

正视与GPT-4的差距,讯飞星火能否扛起AI大旗?

图源:讯飞星火

在大模型之家看来,类似友伴等功能的AI人设内容已在行业中屡见不鲜,以360智脑、百度文心一言等在今年也先后推出了类似功能。在产业落地方面,科大讯飞坚持将大模型融入千行百业中,在此次发布会上牵手行业伙伴共同发布十二大行业大模型、并重磅发布医疗大模型讯飞晓医APP、全新发布AI答疑辅学和AI心理伙伴以及首次发布科技文献大模型等,为行业赋能的坚定决心值得肯定。

正视与GPT-4的差距,讯飞星火能否扛起AI大旗?

图源:科大讯飞

目前,科大讯飞已联合华为打造基于昇腾生态的自主可控大模型算力底座“飞星一号”平台。在此基础上,讯飞星火大模型将开启对标GPT-4的更大规模训练。

刘庆峰表示,中国现有的大模型跟GPT-4比都还是实实在在有差距的,所以我们必须正视今天和GPT-4的差距,找到差距所在。“大模型之战绝对是一场硬仗,绝不是靠吹牛能做成的,只有实事求是的的精神才能真正实现超越。”

正视与GPT-4的差距,讯飞星火能否扛起AI大旗?

此外,刘庆峰再次喊话:在2024年上半年,讯飞星火V4.0发布将全面对标GPT-4,而且绝不仅仅是一个简单的技术对标问题,而是要走出自己的技术路线,走出自己的产业方向。

成也AI败也AI,科大讯飞屡次受累

在10月24日,第六届世界声博会暨科大讯飞1024开发者节上午开幕之际,科大讯飞股价报每股49.47元,但在午后遭遇股价跳水跌停,报46.68元/股。

正视与GPT-4的差距,讯飞星火能否扛起AI大旗?

图源:百度股市通

据相关媒体报道称,近日,有用户反馈,在自家孩子的科大讯飞学习机中的《蔺相如》一文里,发现了违背主流价值观的内容。报道称科大讯飞工作人员表示已经在第一时间做出了响应处理,目前是永久性下架了《蔺相如》这篇文章。接下来将会加强内容安全管理。

联想到今年5月24日,科大讯飞股价一度闪崩跳水,盘中一度跌超9%,当时科大讯飞回应称,系某生成式AI写作虚假小作文导致。

如今科大讯飞也是被AI生成的内容所影响,在高喊“超越ChatGPT”“遥遥领先”等口号后,这也显示出了讯飞星火大模型对于AI生成的内容,无法完全规避AI生成的有害信息。无论是科技发展的必然,还是降本增效的推进,生成式人工智能的可靠性仍然有较大的提升空间,尤其对于如何消除大模型幻觉,是提升人工智能性能与鲁棒性重要课题。

其次,尽管人工智能有潜力生成与人类书面内容一样准确的科学文本,但在深度和整体质量方面仍存在差距,它可能包含语言冗余和事实问题方面的错误,这可能会影响其生成内容的质量和可信度。

正视与GPT-4的差距,讯飞星火能否扛起AI大旗?

图源:科大讯飞第三季度报告

不仅如此,据科大讯飞第三季度财报显示,2023年第三季度公司实现营业收入47.72亿元,同比增长2.89%;毛利19.37亿元,同比增长3.62%;但归母净利润仅为2579万元,同比下滑82%;扣非后归母净利润再度由盈转亏,亏损达2019万元。对此,科大讯飞表示,利润大幅减少系公司在通用人工智能认知大模型等方面投入所致。

正视与GPT-4的差距,讯飞星火能否扛起AI大旗?

图源:科大讯飞第三季度报告

值得注意的是,科大讯飞2023年前三季度计入的政府补助3.02亿元。其中,第三季度计入的政府补助为8119万元。科大讯飞第三季度的研发费用为9.81亿元,相比较去年同期的8.92亿元,同比增加超10.04%;相比二季度的8.01亿元,环比增加22.50%。销售费用从去年的同期的7.59亿元,增加了9.86%至8.34亿元。

在业绩交流会上,科大讯飞董秘、副总裁江涛表示,公司还将陆续推出讯飞星火在运营商、金融、汽车、工业等领域的私有化解决方案,但客户从技术调研到招投标一般至少需要6个月,当前正处于方案对接、效果验证和测试阶段。这意味着,星火大模型可能带来的显著业绩贡献还需等到明年有所体现。

如今,星火大模型已搭载在科大讯飞众多AI产品线中,能够为用户提供智能交互。不过,在全面对标ChatGPT的星火大模型V3.0及相关应用发布后,上述产品将会为科大讯飞的业绩表现带来多大影响,仍有待市场验证。

原创文章,作者:赵小满,如若转载,请注明出处:http://damoai.com.cn/archives/1530

(0)
上一篇 2023年10月20日 下午5:53
下一篇 2023年10月25日 下午8:18

相关推荐

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注