ChatGPT重磅升级 加入语音及图像功能,AI概念集体爆发

  当地时间9月25日,OpenAI官网宣布推出新版ChatGPT,增加了语音输入和图像输入两项新功能。据悉,新功能将在未来两周内向ChatGPT Plus订阅用户和企业用户推出,开发人员等其他用户群体也有望在不久的将来体验。此外,语音输入功能将在iOS和Android平台推出,图像输入功能将登陆所有平台。

  其中,语音输入功能就类似于语音助手,用语音替换原本的文字输入,ChatGPT会将其转换成文本,并以语音的方式将答案播放给用户;图像输入功能,就类似于图片搜索,用户拍下自己感兴趣的事物或者想表达的问题,甚至与语音和文本输入相配合,上传至ChatGPT,就会收到相应的回答。与图片搜索不同的是,ChatGPT可以进行多轮对话,并非简单的搜索,用户可以多次提问,以获得更准确且全面的答案为止。

  事实上,具备语音、图像等多模态特征的生成式AI应用已经成为AI大模型发展的必然趋势。例如,Meta具备AI生成音乐能力的AudioCraft、苹果正在试验的AI生成语音应用Personal Voice等。同时,百度文心一言、阿里云通义千问、科大讯飞星火大模型等均已具备多模态能力。

  今日上午,A股AI概念集体爆发,包括生成式AI、大模型、多模态等十余支个股大涨。例如,智能语音厂商海天瑞声涨停,涨幅达20%。万兴科技、大华股份、寒武纪、科大讯飞等个股也有不同程度的上涨。

  目前,生成式AI的商业化进程有望加速。其中,微软近日宣布将旗下所有GPT-4加持的Copilot功能全部统一为“Microsoft Copilot”,并将于9月26日开始通过Win11免费推送。同时,国内也有一大批AI大模型获批,向公众开放,全面迈向To C端。

  然而,在多模态和商业化等趋势下,生成式AI对算力的需求自然水涨船高,行业或将迎来新一轮的算力竞赛。

「点点赞赏,手留余香」

    还没有人赞赏,快来当第一个赞赏的人吧!
0 条回复 A 作者 M 管理员
    所有的伟大,都源于一个勇敢的开始!
欢迎您,新朋友,感谢参与互动!欢迎您 {{author}},您在本站有{{commentsCount}}条评论