一部手机就可运行，精通 20 种语言！谷歌终于能与 OpenAI 打擂台

　　“也许这有点不合常理，但这是我很长时间以来看到的最好的谷歌 I/O。”有开发者对昨晚如期而至的谷歌 I/O 2023 大会作出了如此评价，“我知道今年人工智能将受到极大关注，但我仍对许多新功能以及这些集成发生的速度感到惊喜。”

　　在这次 I/O 大会上，谷歌试图向大众呈现出自己与 OpenAI 抗衡的实力：发布了与 GPT-4 对打的 PaLM 2、Bard 进化后向所有人开放、移动端也可以用 AI 新功能等等。正如谷歌首席执行官Sundar Pichai 说的，谷歌正在重构自己的所有核心产品，包括搜索。

　　与 GPT-4 对打的 PaLM 2

　　毫无疑问，被寄予厚望的 PaLM 2 成为这次大会的亮点之一。PaLM 2 是⼀种基于 Transformer 的模型，使⽤类似于 UL2 的混合⽬标进⾏训练。

　　谷歌于 2022 年 4 月首次宣布推出 PaLM 模型。PaLM 的应用在这一年取得了很大的进展，今年 3 月，该公司推出了一款适用于 PaLM 的 API 以及一系列人工智能企业工具，帮助企业“通过简单的自然语言提示生成文本、图像、代码、视频、音频等”。这次大会上，Pichai 宣布推出 PaLM 2 预览版本，改进了数学、代码、推理、多语言翻译和自然语言生成能力。

　　多语言能力

　　谷歌声称，PaLM 2 是一种最先进的语言模型，具有改进的多语言、推理和编码功能。PaLM 2 在所有数据集上都优于 PaLM，并取得了与 GPT-4 竞争的结果。

　　之前的大型预训练语言模型通常使用以英语文本为主的数据集，谷歌设计了一个更多语言和多样化的预训练混合模型，扩展到数百种语言和领域(例如编程语言、数学和并行多语言文档)。更大的模型可以处理更多不同的非英语数据集，而不会导致英语语言理解性能的下降，并应用重复数据删除来减少记忆。

　　PaLM 2 在多语言文本方面接受了更多的训练，涵盖 100 多种语言，显着提高了其在多种语言中理解、生成和翻译细微差别文本(包括成语、诗歌和谜语)的能力。根据基准测试，对于具有思维链 prompt 或自洽性的 MATH、GSM8K 和 MGSM 基准评估，PaLM 2 的部分结果超越了 GPT-4。

　　PaLM 2 还通过了“精通”级别的高级语言能力考试。其中，PaLM 2 的日语水平达到了 A 级，而 PaLM 是 F 级。PaLM 2 的法语水平达到了 C1 级。

　　PaLM 2 和 PaLM 在最新的专业语⾔能⼒考试中的表现

　　不仅如此，PaLM 2 还了解重要的语言细微差别。在一篇描述 PaLM 2 功能的研究论文中，谷歌工程师声称该系统的语言熟练程度“足以教授该语言”，并指出这是由于其训练数据中非英语文本更为普遍。

　　PaLM 2 的广泛数据集包括科学论文和包含数学表达式的网页，因此它还展示了逻辑、常识推理和数学方面的改进能力。

　　PaLM 2 推理能力示例

　　支持 20 种编程语言

　　PaLM 2 还改进了对编写和调试代码的支持。该模型使用 20 种编程语言进行了训练，包括 JavaScript 和 Python 等流行语言，还包括 Prolog、Verilog 和 Fortran 等语言。PaLM 2 构成了 Codey 的基础，Codey 是谷歌用于编码和调试的专业模型，它也作为其代码完成和生成服务的一部分推出。

　　代码语⾔模型是当今最具经济意义和被⼴泛部署的 LLM 之⼀。为了在开发⼈员⼯作流程中进⾏低延迟、⾼吞吐量部署，谷歌通过在扩展的、代码密集型、多语⾔的数据混合上继续训练 PaLM 2-S 模型，构建了⼀个⼩型的、特定于编码的 PaLM 2 模型，谷歌将⽣成的模型称为 PaLM 2-S* 。

　　PaLM 2-S* 在大量公开可用的源代码数据集上进行了预训练。它擅长 Python 和 JavaScript 等流行的编程语言，但也可以生成 Prolog、Fortran 和 Verilog 等语言的专用代码。

　　PaLM 2-S*在除了两种语言之外的所有语言上都优于 PaLM，同时在像 Julia 和 Haskell 这样的低资源语言上几乎没有下降。例如，PaLM 2-S*在 Haskell 上比更大的 PaLM-Coder-540B 提高了 6.3 倍，在 Julia 上提高了 4.7 倍。值得注意的是，Java、JavaScript 和 TypeScript 的性能实际上比原始语言 Python 更高。

　　PaLM 2 可以跨编程和自然语言生成代码和自然语言。大会上，Pichai 还展示了在修改代码 Bug 后，PaLM 2 给出的韩语评论。

　　谷歌内部已经有超过 70 个产品团队正在使用 PaLM 2 构建产品，包括分别针对安全知识和医疗知识微调而成的 Sec-PaLM 和 Med-PaLM 2。

　　其中，Sec-PaLM 是专注于安全用例的版本，使用 AI 帮助分析和解释具有潜在恶意脚本的行为，并检测哪些脚本对个人或组织构成威胁。Med-PaLM 2 是基于健康数据训练的版本，可以轻松通过美国医学执照考试，达到“专家”水平。