首个“有了眼睛”的国产大模型亮相服贸会

作者: 澎湃新闻   日期:2024-09-14 11:15 阅读:0  来源:澎湃新闻  
分享到:
邮箱:

据澎湃新闻报道,国产大模型成功解锁“眼睛”,智谱AI(即北京智谱华章科技有限公司)在9月12日开幕的2024年中国国际服务贸易交易会(简称服贸会)上展示了最新发布的清言App “视频通话”功能。据悉,这是全球首个面向大众用户开放的大模型视频通话功能。

据介绍,清言视频通话功能跨越文本、音频和视频三大模态,具备实时推理能力。用户可以打开摄像头,通过视频通话窗口与清言交流,清言不仅能“看”到用户画面,还能听懂指令并准确执行,即便频繁打断也能迅速反应。在画面上划重点,清言还可以理解用户想让它重点关注的地方。

 

提供作业辅导。


智谱AI表示,此前GPT-4o上线了语音但并未对公众开放视频功能,利用清言可以体验到目前最前沿的AI/大模型技术。过去和AI交互主要是文字形式,有了视频功能,用户可以告别文字长篇大论的提示词和AI丝滑交流。清言就像用户身边有眼力见、能听懂话的人类助手,只要摄像头一拍,AI就能知道用户的环境、想让AI做的事,用户只需口头吩咐。

 

国产大模型成功解锁“眼睛”。


清言视频通话功能还可变身随身英语翻译,可实现即时翻译中英文,根据用户所处环境信息进行英语对话,并协助纠正用户的语音和语法错误。这一功能的使用场景包括在旅游时随时讲解景点故事,为视障人士识别环境等,还可以提供学科作业辅导、面试指导,在会议中完成纪要和总结,分析复杂的数据图表,实时解读电脑屏幕的代码。

在此次服贸会上,智谱AI将展示多款最新产品。除了清言App的视频通话功能外,还包括AI生成视频功能。智谱今年早些时候推出了视频生成模型CogVideoX,并在智谱清言App上线具备视频生成的“清影”功能。清影面向所有用户开放,只需输入文本或上传图片,30秒内即可生成6秒视频。今年7月,清影上线清言App,六天时间用户生成超过100万支视频。

版权声明
1. 未经《新西兰天维网》书面许可,对于《新西兰天维网》拥有版权、编译和/或其他知识产权的任何内容,任何人不得复制、转载、摘编或在非《新西兰天维网》所属的服务器上做镜像或以其他任何方式进行使用,否则将追究法律责任。


2. 在《新西兰天维网》上转载的新闻,版权归新闻原信源所有,新闻内容并不代表本网立场。

版权声明
1. 未经《新西兰天维网》书面许可,对于《新西兰天维网》拥有版权、编译和/或其他知识产权的任何内容,任何人不得复制、转载、摘编或在非《新西兰天维网》所属的服务器上做镜像或以其他任何方式进行使用,否则将追究法律责任。


2. 在《新西兰天维网》上转载的新闻,版权归新闻原信源所有,新闻内容并不代表本网立场。

新闻评论须知

· 请您文明上网、理性发言

· 尊重网上道德,承担一切因您的行为而直接或间接引起的法律责任

· 您的留言只代表个人意见,不代表本站立场

· 天维网拥有管理笔名和留言的一切权利

· 您在天维网留言板发表的言论,天维网有权在网站内转载或引用

· 天维网新闻留言板管理人员有权保留或删除其管辖留言中的任意内容

· 参与本留言即表明您已经阅读并接受上述条款

验证码:
×

查看所有评论  共( 条)

Click here

Advertising With Us