更强大恐怖的GPT-4来了，考试表现优于人类，性能远超ChatGPT

　　3月15日凌晨2点，OpenAI正式发布了升级后的GPT-4。

　　GPT-4是一个多模态大模型，可以接受文本和图像形式的输入，能使用文本解析并回应这些查询。在ChatGPT Plus上，开发人员可以通过API构建应用程序和服务。据了解，OpenAI花了6个月的时间让GPT-4在内容生成方面更加安全和一致。内部评估中，相比于GPT-3.5，GPT-4不合规内容的响应请求减少了82%，响应事实准确度增加了40%，高级推理能力也超过了ChatGPT。

　　根据OpenAI的说法，GPT-4是其 “迄今为止最先进的系统”，在一些学术和专业基准上具备 “人类水平的表现”，远超其前任ChatGPT，比如在美国律师考试、高级分类考试和SAT考试中，其得分高于88%的应试者。

　　该公司还预示了一些潜在隐患，“尽管有这样的能力，GPT-4与早期的GPT模型有类似局限性：它并不完全可靠(会出现‘幻觉’)，背景窗口幅度有限，并且不能从经验中学习。”

　　该公司补充称，用户在使用GPT-4输出时应保持谨慎，特别是在需要保证可靠性的情况下。

　　OpenAI表示不会透露GPT-4技术方面的任何细节，包括模型的架构、用什么数据进行训练或用来部署模型的硬件和计算能力。

　　为了测试技术潜在危害，OpenAI还对GPT-4进行了压力测试，并提出了偏见、虚假信息、隐私和网络安全的相关风险。测试显示，GPT-4可以产生潜在的有害内容，如关于计划攻击或仇恨言论的建议。OpenAI称，GPT-4甚至能提供关于如何进行非法活动的详细信息，包括开发生物武器。

　　值得一提的是，OpenAI还在与一个外部组织合作，测试GPT-4是否能在没有人类输入的情况下进行自主行动。

　　相比ChatGPT，GPT-4目前具备的性能提升如下：

　　更好的创造性。能够在创意和技术写作任务中与用户一起生成、编辑和迭代“风格”，例如创作歌曲、编写剧本或学习用户的写作风格进行生成内容。

　　视觉输入上GPT-4可以接受图片作为输入并生成标题、说明、分类和分析。

　　更长的上下文处理。GPT-4能够处理超过25000个单词的文本，并可以直接将链接加入到提问内容中。

　　高级推理能力超越ChatGPT。OpenAI表示，它已经将其GPT-4嵌入到各种应用中，包括语言学习应用Duolingo，该应用正在使用其建立一个对话式语言机器人;教育公司Khan Academy，该公司设计了一个在线导师;以及摩根士丹利财富管理公司，该公司正在测试一个使用GPT-4为其员工检索和合成信息的内部聊天机器人。