更强大恐怖的GPT-4来了,考试表现优于人类,性能远超ChatGPT

  3月15日凌晨2点,OpenAI正式发布了升级后的GPT-4。

  GPT-4是一个多模态大模型,可以接受文本和图像形式的输入,能使用文本解析并回应这些查询。在ChatGPT Plus上,开发人员可以通过API构建应用程序和服务。据了解,OpenAI花了6个月的时间让GPT-4在内容生成方面更加安全和一致。内部评估中,相比于GPT-3.5,GPT-4不合规内容的响应请求减少了82%,响应事实准确度增加了40%,高级推理能力也超过了ChatGPT。

  根据OpenAI的说法,GPT-4是其 “迄今为止最先进的系统”,在一些学术和专业基准上具备 “人类水平的表现”,远超其前任ChatGPT,比如在美国律师考试、高级分类考试和SAT考试中,其得分高于88%的应试者。

  该公司还预示了一些潜在隐患,“尽管有这样的能力,GPT-4与早期的GPT模型有类似局限性:它并不完全可靠(会出现‘幻觉’),背景窗口幅度有限,并且不能从经验中学习。”

  该公司补充称,用户在使用GPT-4输出时应保持谨慎,特别是在需要保证可靠性的情况下。

  OpenAI表示不会透露GPT-4技术方面的任何细节,包括模型的架构、用什么数据进行训练或用来部署模型的硬件和计算能力。

  为了测试技术潜在危害,OpenAI还对GPT-4进行了压力测试,并提出了偏见、虚假信息、隐私和网络安全的相关风险。测试显示,GPT-4可以产生潜在的有害内容,如关于计划攻击或仇恨言论的建议。OpenAI称,GPT-4甚至能提供关于如何进行非法活动的详细信息,包括开发生物武器。

  值得一提的是,OpenAI还在与一个外部组织合作,测试GPT-4是否能在没有人类输入的情况下进行自主行动。

  相比ChatGPT,GPT-4目前具备的性能提升如下:

  更好的创造性。能够在创意和技术写作任务中与用户一起生成、编辑和迭代“风格”,例如创作歌曲、编写剧本或学习用户的写作风格进行生成内容。

  视觉输入上GPT-4可以接受图片作为输入并生成标题、说明、分类和分析。

  更长的上下文处理。GPT-4能够处理超过25000个单词的文本,并可以直接将链接加入到提问内容中。

  高级推理能力超越ChatGPT。OpenAI表示,它已经将其GPT-4嵌入到各种应用中,包括语言学习应用Duolingo,该应用正在使用其建立一个对话式语言机器人;教育公司Khan Academy,该公司设计了一个在线导师;以及摩根士丹利财富管理公司,该公司正在测试一个使用GPT-4为其员工检索和合成信息的内部聊天机器人。

「点点赞赏,手留余香」

    还没有人赞赏,快来当第一个赞赏的人吧!
0 条回复 A 作者 M 管理员
    所有的伟大,都源于一个勇敢的开始!
欢迎您,新朋友,感谢参与互动!欢迎您 {{author}},您在本站有{{commentsCount}}条评论