0°

一手体验,阿里巴巴版ChatGPT,更智能还是更“智障”?

  人工智能产品的“轰炸”一波接一波,这次轮到阿里巴巴了。

  上月就传阿里会推出自己的ChatGPT应用,如今传言成真。小郝拿到了这个“通义千问”的测试码,且看它实力几何。

  爱搞事的小郝试了试ChatGPT、New Bing等曾犯过的“经典”错误,对比看看,AI是否改进了“智障”翻车的老毛病。

  1、唐太宗和赵匡胤打仗的问题,“通义千问”明确了历史时序,没有像其它平台那样一本正经地胡说八道。

  2、数学问题:766乘以1356等于多少,“通义千问”回答也没有问题。

  3、在鸡兔同笼、青蛙爬井这样的数学应用题上,“通义千问”并没有比其它人工智能更智能,同样回答错误,这块恐怕还需要语义理解和CoT思维链技术的改进。

  4、小郝用夹杂错误的提问,让它解读“乔治巴顿拿着苹果iPhone指挥部队”的情况,它编出了一个故事,显然,“通义千问”把iPhone当作当年摩托罗拉生产的SCR无线电话,放了进去。

  5、最后,小郝问了一个土味情话,它显然还看不懂“谐音梗”的意义。看来人工智能还不能在这方面替代人。

  整体看,“通义千问”有优于其它文生文AI模型的地方,对可能的错误已经有所改进,有“智能”的进化,但在数学应用题解读、财报数据爬取等方面,还和其它平台一样,有改进的空间。

  按小郝几个月的AI经验,最好的Prompt(提问)方式是“3W”模式,即What、Who、Want——情况是什么?要扮演什么角色?想让它做什么?

  这三点明确,就能提出好问题,AI也会回答得更精准。

  总体来说,“通义千问”是让人与AI交互,又向前推进了一步。

  同时,从其二级界面来看,“通义千问”更像Notion AI,包含更细分的小学生作文、提纲、写诗等细分功能,其角色定义应该是一个“AI改进工作效率的工具或助理”。

「点点赞赏,手留余香」

    还没有人赞赏,快来当第一个赞赏的人吧!
0 条回复 A 作者 M 管理员
    所有的伟大,都源于一个勇敢的开始!
欢迎您,新朋友,感谢参与互动!欢迎您 {{author}},您在本站有{{commentsCount}}条评论