大模型之家讯 9月12日至9月16日,2024年中国国际服务贸易交易会(服贸会)在国家会议中心和首钢园区盛大举办,本届服贸会的主题是“全球服务,互惠共享”。在北京首钢会展中心2号馆,智谱展示了多款最新产品,包括旗下清言App近期重磅推出的“视频通话”功能、清影AI生成视频功能,以及大模型开放平台bigmodel.cn等,诸多AI黑科技亮相引发广泛关注。
清言作为首批上线的C端大模型产品,过去一年中以文字和语音形式与用户互动。如今,清言迎来重大升级,解锁了“眼睛”, 这是全球首个面向大众用户开放的视频通话功能,让用户体验到目前最前沿的AI/大模型技术,正式进入视频通话时代。
清言视频通话功能跨越文本、音频和视频三大模态,具备实时推理能力。用户可以打开摄像头,通过视频通话窗口与清言交流,清言不仅能“看”到用户画面,还能听懂指令并准确执行。即使用户频繁打断,清言也能迅速反应,带来如同真人视频通话的流畅体验。另外可以用右下角小画笔在画面上划重点,清言可以知道你着重让它看的地方是哪。
使用方法也十分简单,只需下载智谱清言APP, 点击右下角的通话按钮,进去之后再切换到视频,就能开启一个全新的世界与小智愉快畅谈。
清言视频通话功能可以成为你生活、学习和工作中的得力助手。在生活方面,小智可以提供穿搭技巧、机器的使用方法、识别场景讲述背景故事。
当大语言模型解锁了“看见”和“说话”的能力,AI在学习和生活中的应用更广泛了。
首先,清言变身成了一位随身的英语翻译,以及能够随时随地开展情景教学的英语老师。清言不仅能够即时翻译中英文,还能根据用户所处的环境信息进行英语对话,并且协助纠正用户的语音和语法错误。
其次,清言还可以是孩子们的“大眼百科”。孩子们可以用视频拍摄环境,并且让清言解释环境中陌生的物体叫什么、能做什么、英语怎么说等等。此外,清言还可以为孩子们阅读绘本故事、玩你画我猜等游戏,成为孩子们益智启蒙的最佳玩伴。
当然,有了视频通话功能后,清言还可以成为旅游时随时讲解景点故事的导游,也能为视障人士提供识别环境的帮助。还有更多场景和功能,等待大家一同发现。
在工作当中,小智可以提供面试指导、会议中完成纪要和总结、分析复杂的数据图表、实时解读电脑屏幕的代码。
小智还能成为你的学习搭子,为你提供学科作业辅导。
无聊时小智还能是你的知心朋友,与你聊天玩游戏。
见证了视频通话功能的强大之外,智谱近期推出的视频生成模型CogVideoX以及在智谱清言App上线的“清影”功能也吸引了不少观众驻足打卡。据了解,清影面向所有用户开放,只需输入文本或上传图片,30秒内即可生成6秒视频。今年7月,清影上线清言App,六天时间用户生成超过100万支视频。
实际上最近一段时间以来智谱动作频频,称得上是技术动作最密集的大模型公司:一周前,智谱刚刚在 KDD 上发布了升级版基座大模型GLM-4-Plus,以及CogView-3-Plus 和 CogVLM 在内的多模态模型,展示智谱对图像、视频等更多模态方面的研究进展,这正是业界公认的大模型的下一步。同时,类 GPT-4o 的视频通话功能在 C 端产品智谱清言上率先上线。7 月,智谱生视频功能清影 Ying 上线智谱清言,并很快将其背后的生视频模型 CogVideoX 开源。通过大模型链接物理世界亿级用户,智谱致力于为千行百业带来持续创新与变革,加速迈向通用人工智能时代。
原创文章,作者:王昊达,如若转载,请注明出处:http://damoai.com.cn/archives/7222