上线AI效率工具,跃问能否“实至名归”?

有人说,2023年是大语言模型元年。彼时,一场由ChatGPT引发、使大众重新审视的新一代科技革命在全球掀起浪潮。此后,进度条随着“OpenAI官网技术博客上透露的‘GPT-4的一个重大提升是开始涉及多模态’再次刷新。多模态模型将在2024年迎来爆发开始成为行业共识。

回顾来看,多模态大模型在国内从来都不是“稀有物种”。从早期的阿里巴巴达摩院和清华唐杰教授团队,紫东太初团队;到如今百度、腾讯、字节跳动等科技巨头“成果”的相继开放,其以能够融合不同模态的数据、实现跨领域应用的一体化、在对话系统和人机交互方面优势显著等优势获得了用户和厂商的青睐。

上线AI效率工具,跃问能否“实至名归”?

图源:阶跃星辰

4月9日,阶跃星辰基于 Step-1 和 Step-1V 千亿参数大模型的效率工具“跃问”正式开放了。

据悉,跃问是一款AI效率工具,能理解和生成文本,分析图像内容,为用户提供信息查询、语言学习、创意写作、图文解读、一键生成信息长图等多样化服务,极大提升了信息获取和内容产出的效率,帮助用户在工作、学习、生活等各种场景下解决问题。

目前,用户可在手机微信搜索栏输入关键词 “跃问”,或是通过官方微信给出的相关链接参与体验。

上线AI效率工具,跃问能否“实至名归”?

图源:跃问

阶跃星辰在官宣中提到,其大模型的能力直逼 ChatGPT3.5 和 ChatGPT 4.0。接下来,就请跟着大模型之家的脚步,体验一下跃问的真实能力吧!

六大场景全体验,跃问招架的住吗?

首先,是十分常见的语言理解交互能力。这part我们主要选取了3个问题,分别涉及实际生活、地理知识及俗语理解等。

问题二:

图源:跃问

上线AI效率工具,跃问能否“实至名归”?

问题三:

上线AI效率工具,跃问能否“实至名归”?

图源:跃问

整个体验过程十分流畅,跃问的响应速度也确实“可圈可点”。同时,在其给出的三个回答中,除了中规中矩的答案外,其还在涉及俗语理解的“多生孩子好打架的说法是正确的吗”一题中,做出了发散式联想,从而衍生出了以汽车企业为主的多品牌运营模式思考。

不过,虽然这样的思考及表达方式,在一定程度上能够突出跃问思维的发散性及或增强其商业化表达效果,但是倘若不加节制或运用不当,却容易造成画蛇添足之效。

接下来,是跃问的通用能力测评。在这个部分上,我们将分别从图像理解(图片内容解读、根据图片创作、看图识别地点)、数学能力、逻辑推理、论文翻译等方面进行测评。

图像理解方面:

我们上传了一张2024年乘联会的销量截图,并让它解读其中的信息:

上线AI效率工具,跃问能否“实至名归”?

图源:跃问

从回答来看,跃问的确是在“仔细解读图片信息”后给出的答案,且答案在条理性、整体性、甚至是相关信息的补充上都做出了十分全面的“响应”。不过,在答案的细节总结上(以销量为例,在总结过程中,并未做出传统车企及新能源车企的严格划分)仍稍有欠缺。可见,倘若用户想要跃问对一些涉及到具体分类的问题进行解答,那么最好是单独提问并且将要求尽可能细化。

语言理解

问题1:

上线AI效率工具,跃问能否“实至名归”?

图源:跃问

不难发现,跃问在回答中能够对中文句式和意义进行准确把握,并给出相对符合逻辑的解释,但在思考问题的严谨性上有所欠缺。以上文问题为例,在问题“在第一次跑步中,你超过了第二名,你是第几名”?的思考中,其忽略了跑道的形状,从而给出了一个并不完全的答案。(正确答案应为跑道是直的的话你就是第二名;2、跑道是环型的话你是第几名都有可能。二、赛跑的人数 ≥ 2 且 你的名次 = 1 且 跑道是环型:绝对性的第一名)。

问题2:理解能力+联网能力二合一的应用

上线AI效率工具,跃问能否“实至名归”?

图源:跃问

从回答来看,大模型结合了多个角度思考,并从设计风格到欣赏角度,再到整体的性能等方面做出了较为全面的评价。同时,跃问在联网能力上表现也颇为出色,尤其是具体的新闻来源和报告的罗列,对于需要最新信息的用户来说很有价值。

数学能力方面

问题1:先来个简单的鸡兔同笼问题。

上线AI效率工具,跃问能否“实至名归”?

图源:跃问

不仅回答正确!而且回答速度还挺快!

问题2:难度升级!

上线AI效率工具,跃问能否“实至名归”?

图源:跃问

这个问题回答用的是“基础概率学原理”,同时还使用 Python 代码做了实际演示。对于笔者这种数学智障或许暂时没什么使用机会,但对于从事财务或数据分析工作的人来说,确实是个提升效率的好帮手。

逻辑推理方面

问题1:

上线AI效率工具,跃问能否“实至名归”?

图源:跃问

整个回答非常的有条理,逐步排除和分析,整个过程既严密又易于跟踪,最终得出的结论逻辑上自洽且有说服力。

论文翻译

上线AI效率工具,跃问能否“实至名归”?

图源:跃问

翻译能力方面,大模型之家以小说《老人与海》《追风筝的人》的节选部分为例进行了测试。从操作上来看,跃问的上传文件即可直接完成翻译需求,将用户在实际使用中的流程实现了化繁为简的迭代。同时,目前的翻译结果也与原文高度一致,呈现“口语化”风格,且翻译语句语态大部分均为正确。

不过,大模型尝试输入学术性论文后发现,目前的跃问暂时无法很好的理解“专业性”符号及语言。同时,倘若文章篇幅较长,跃问还会在翻译过程中出现乱码的情况,虽然在“重新启动”后对原有格式进行了纠错,但这也将在一定程度上影响用户的使用感受及跃问的“权威性”。

诚然,虽然现阶段的跃问目前仍有些许待完善之处,但整体体验下来仍瑕不掩瑜。同时,跃问的出现确实在一定程度上对原有交互方式进行了模态上的拓宽与深入。它不仅更能理解用户的自然语言,还不再局限于单纯的罗列答案,保证了用户对信息源可追溯性。同时,也将提高阶跃星辰的品牌影响力,吸引更多用户和合作伙伴的关注。

阶跃星辰与AI的结合:C端应用场景下的无限想象力

据艾瑞咨询发布的最新报告显示,2023年,中国生成式AI(AIGC)产业规模约为143亿元,预计到2030年,中国AIGC产业生态日益稳固,完成重点领域、关键场景的技术价值兑现,中国AIGC产业规模届时有望突破万亿元,达到11441亿元。万亿产业规模带来了C 端AI 应用更大规模的市场前景。

目前,阶跃星辰主要聚焦于C端场景,并致力于通过自有产品与合作产品的双重路径,进行深入而广泛的探索。值得注意的是,几乎在跃问推出的同一时间,旗下AI开放世界平台“冒泡鸭”也已经正式全面开放使用。

根据官方介绍,“冒泡鸭”是一款AI陪伴型应用,它为用户提供了与不同角色智能体进行对话的选择。同时,在对话结束后,智能体会主动提供一系列可选择的回复。

此外,阶跃星辰在金融、网络文学、知识服务等领域已与合作伙伴达成深度合作,共同探索面向C端用户的创新应用。

而跃问的问世,不仅是阶跃星辰在To C场景下应用AI技术的一个典型案例,也在一定程度上展示了阶跃星辰在C端应用场景下利用AI技术创造价值和优势的无限想象力。

首先,作为一款效率工具,跃问可以作为智能客服机器人,通过理解用户的问题并提供准确的回答来提高客户满意度。在内容创作领域,跃问可以帮助创作者生成文章、报告等内容,提高创作效率。

其次,跃问的计算机视觉能力使得它能够理解和分析图像和视频内容,这在现下电商领域中的商品推荐系统上,有得天独厚的优势。通过分析用户的图像或视频数据来推荐个性化的商品,从而优化和提升用户的购物体验。

此外,跃问的推理和决策能力也为其带来了新的想象空间。例如,在金融领域,跃问可以用于风险评估和投资决策,通过分析大量的金融数据来预测市场趋势和风险。在医疗领域,跃问可以用于辅助诊断和治疗决策,通过分析患者的病历和医学影像数据来提供个性化的治疗建议。

大模型之家认为,跃问是阶跃星辰在C端场景下应用AI技术的一个典型案例,展示了其在大模型技术方面的领先水平和创新能力。同时,通过跃问与不同行业的需求相结合,阶跃星辰可以为客户提供个性化的AI解决方案。作为一款具有领先技术的AI产品,其技术规范和应用实践将为其他AI企业提供参考和借鉴,从而推动整个AI行业的规范化发展

原创文章,作者:欧 玉娇,如若转载,请注明出处:http://damoai.com.cn/archives/4616

(0)
上一篇 2024年4月11日 上午11:17
下一篇 2024年4月11日 下午6:32

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注