为何ChatGPT有时“一本正经地胡说八道”

　　彭敏武汉大学人工智能系系主任、教授

　　李祖超武汉大学副研究员

　　□ 长江日报记者陈静茹

　　最近，应用软件ChatGPT在多国社交媒体“狂飙”。发布两个月后，月活人数成功过亿，成为史上用户增速最快的消费者应用。2月20日，清华大学人工智能国际治理研究院副院长、公共管理学院教授梁正，武汉大学人工智能系系主任、教授彭敏和武汉大学副研究员李祖超做客长江日报《面谈》，畅聊风暴眼中的ChatGPT。网友在线上同三位教授一起热议ChatGPT，各平台观看视频网友达70万。

　　ChatGPT能做什么?有没有与它聊过天?

　　它的回答质量依赖于用户问题的清晰程度，问题定义越清晰，ChatGPT回答得越具体越有根据。

　　梁正：作为科研工作者，我最关心的是ChatGPT可以给我们提供什么帮助。因为我是做人工智能的治理研究，也就是人工智能会带来什么样的风险、什么样的问题，所以我首先问他“你会对人类产生什么样的影响?应该怎么去应对?”它的回答很官方，也很全面。

　　彭敏：首先ChatGPT的编写代码能力让我印象深刻。此外，我的研究领域是人工智能的对话，所以在这方面比较关注，我觉得它在多意图多轮的对话中，表现非常好。

　　李祖超：在和ChatGPT聊天的过程中，我发现它的回答质量依赖于用户问题的清晰程度，问题定义越清晰，ChatGPT回答得越具体越有根据。

　　ChatGPT像是一个十四五岁的孩子吗?

　　实际上，只要经过稍微调教，ChatGPT的回答风格则可以发生巨大的变化，远不止十四五岁孩子的表达能力。从掌握知识的深度来说，ChatGPT应该相当于一个某专业领域的初级到中级水平。

　　梁正：在一般生活对话的场景方面，我认为ChatGPT已经达到了十四五岁孩子的能力，甚至在有的领域它可以达到大学本科毕业生这样的水平，包括医师资格考试、大学入学考试等都可以完成。它不是只在一个领域去发挥作用，它在一些专用领域的表现更好。

　　彭敏：我们不能笼统地来讲ChatGPT的能力。它在很多领域确实是做得非常卓越，背后对应的是它所支撑的技术、数据或者是知识。但在某些领域，它又非常匮乏，不具备一定的智能。

　　李祖超：将ChatGPT对照十四五岁的孩子我认为是不完全确切的。这需要从几个层面来讲。从语言表达能力来说，ChatGPT看上去像一个十四五岁的孩子讲的话。这主要是大众在试用ChatGPT时都采用闲聊的方式，并且ChatGPT训练的目的是作为助手。但是实际上，只要经过稍微调教，ChatGPT的回答风格则可以发生巨大的变化，远不止十四五岁孩子的表达能力。从掌握知识的广度来说，ChatGPT可以同时记忆天文、地理、物理、化学、计算机等等行业知识，而人类一般无法掌握这么多领域的知识。从掌握知识的深度来说，ChatGPT应该相当于一个某专业领域的初级到中级水平。ChatGPT本质上是在模拟人的对话过程，它的模拟能力是利用一个神经网络大模型，从大规模的训练语料学习出来的，其实现基于四个要素：覆盖广泛的训练语料、算力、一些算法技巧和人工调优技巧。ChatGPT在知识方面的上限取决于训练它的语料库。如果语料库里面没有的知识，它是无法回答的，同时如果训练语料中的知识本身就是错的，它也会回答错误。此外，ChatGPT在计算方面的能力是弱于十四五岁的孩子，约等于八九岁孩子，这也是未来ChatGPT进一步进化的方向之一。

　　可以调教ChatGPT吗?

　　它的回答都会按照你的风格进行生成。或者严厉的老师，或者老板等等角色。

　　ChatGPT真的能取代人类的某一些职业吗?

　　李祖超：我们是可以对ChatGPT进行调教的。你的性格是什么样的，你讲什么样的话，比如你的表现是非常软萌的，它的回答都会按照你的风格进行生成。或者严厉的老师，或者老板等等角色。

　　ChatGPT真的能取代人类的某一些职业吗?

　　这种职业替代形式，人工智能发展过程中一直存在。能力更强更通用的ChatGPT将进一步加快职业形式的变化过程。

　　梁正：我个人的观点，ChatGPT在给我们提供帮助上，它的潜力是巨大的。这个“替代”只是把人类不愿意做的，或者人类觉得比较辛苦和繁复的工作去替代掉，但我不认为它可以把人类有创意的、创造性的这部分工作替代掉，包括对我们做科学研究做学术研究也是一样。

　　彭敏：什么工作是不能被替代的?具有创意的，或者说在我们的基础搜索或者是生成之后，还需要去进行相应的人类智慧去给它一些指导的工作。此外，ChatGPT在某些领域提高了生产力并不代表剥夺了大家的饭碗，这一产品研发的初衷正是为了替人去做一些重复工作，让人可以有时间和精力去做自己更擅长、更适合人类做的创新性的工作，更好地享受生活。

　　李祖超：这种职业替代形式，人工智能发展过程中一直存在。如2015年，美联社使用机器人写作，年报道量超过15亿条，领域涉及金融、房地产、体育等领域。目前，空中客车公司使用人工智能而不是人类工程师来设计飞机，制药公司葛兰素使用人工智能进行药物开发，工作效率和任务完成质量都比人类工程师更好。人工智能甚至可以拍电影。2019年上演的科幻短片《走神》，就是一部剧本、导演、表演、配乐等一系列制作程序，大部分由人工智能所完成的影片，仅用了2天时间。能力更强更通用的ChatGPT将进一步加快职业形式的变化过程。

　　这样的AI意味着什么?

　　我们需要去做的是：每个人都应该去使用、去探索怎么去跟它更好地合作，利用它优越的一面。它的影响不仅仅体现在产业上，还体现在社会、教育、人际交往的变化上。能引起整个分工关系和人际关系的深刻变化。

　　梁正：从信息的处理、内容的生成上，ChatGPT的效率和质量都得到了一个飞跃，这是特别的、积极的一方面。所以它其实会对我们未来提供更好的选择。但我们也不要去神话它，在很多问题上，比如说推理的能力，比如说一些常识，它还是不具备无中生有的能力。ChatGPT在效率提升这一方面是非常明显的，特别是在内容创作上。在ChatGPT大大提高效率以后，我们需要去做的是：每个人都应该去使用、去探索怎么去跟它更好地合作，利用它优越的一面。然后结合自己的优势，把你原来所不擅长的一部分工作交给它去做。它能引起整个分工关系和人际关系的深刻变化。ChatGPT的影响不仅仅体现在产业上，还体现在社会、教育、人际交往的变化上。

　　彭敏：ChatGPT在效率提高这件事上，毋庸置疑。它并不仅仅是提高了信息检索的能力，更重要的是在装备制造、集成电路、大型工程设计等等方面，都可以借助于它的能力提高效率。在将来可能会出现类似于工业5.0，推动整个社会和人类的进步。这也是为什么现在大家都会对它有期待。另外一个角度，我们要看到会出现很多问题。比如，大家用它去写作带来的著作权问题，还有信息的真伪问题等。

　　李祖超：人类历史的发展总体上来看就是生产效率的不断提高的过程。人工智能是当下信息时代的蒸汽机，实用性很高。用户使用ChatGPT获取信息的效率不亚于现在已经非常成熟的搜索引擎。它基于用户需求为创造提供灵感，提高了效率，这将对所有的人类创作领域产生重要的影响。也许未来，人类创作中发挥的作用是作为鉴赏家对人工智能创作进行筛选以及微调。但与此同时，ChatGPT在提高创作效率的同时，使用的大量来源广泛的知识资源所涉及的知识产权如何界定?其行为表现及后果与相关自然人法人之间的法律责任如何确定?这些问题都会成为值得关注的焦点。

　　例如，如果医院门诊的大多数功能，像挂号候诊、检查检验、病情诊断、医嘱处方等都可以由人工智能承担，那主诊医生与人工智能体的职能划分和权责关系如何界定?特别是人工智能体如果达到诊断差错率显著地低于主诊医生误诊率的水平，那处方权应归谁?在更多的行业都将发生类似现象。对此，都须有新的规则来维护新的秩序。

　　ChatGPT会成为操作系统平台的新雏形吗?

　　这是真正可能引爆整个产业智能化转型非常重要的方向。

　　梁正：在产业发展当中，ChatGPT是具有类似于操作系统，或者是通用界面、主导设计的这样一个里程碑式的进步产品，可能未来一个非常大的产业的发展空间被打开了。其实从我们研究产业创新的角度来看，一个行业它从技术的突破到真正的商业化，然后到规模化和普及化，它确实是要经历这样一个过程。现在，ChatGPT给大家提供了一个模板，可以在这个基础上去考虑怎么去为各行各业赋能。所以，这是真正可能引爆整个产业智能化转型非常重要的方向。

　　彭敏：ChatGPT比以往深度学习更有优势的是面对超大规模数据，摆脱了做大量语料标注的工作，是一种无监督学习。此外，它还拥有强化学习、指令微调、思维链等先进技术。从技术的角度，ChatGPT对于整个人工智能是具有里程碑意义的。

　　李祖超：对于ChatGPT是否能成为操作系统的新雏形这个问题，我的答案是积极的。操作系统的作用根据用户指令实现资源的分配以及计算的调度，那么ChatGPT发挥的作用是充当新的人机接口，更智能地实现用户指令的解译，减少用户的操作。从更长远来看，通过赋予ChatGPT管理系统资源如硬盘、CPU、外设等能力，将ChatGPT直接作为一种操作系统，用户只需要输入自然语言便可以达到操作的目标，应该是新一代操作系统的雏形。

　　ChatGPT有时“一本正经地胡说八道”的原因是什么?

　　它的能力远远没有到拟人的程度。“一本正经地胡说八道”可能也是它创造性回答的部分。

　　梁正：ChatGPT可以无中生有，所以叫做“生成式”。背后有大量的人类的知识以及我们对它的引导和奖励的策略。人类告诉它，什么是对错。它在专业领域讲得头头是道，如果聊个人的喜好情绪等，它的能力远远没有到拟人的程度。“一本正经地胡说八道”可能也是它创造性回答的部分。ChatGPT“一本正经地胡说八道”，那么谁来判断?只有人才能判断。当然有一些工作不要求创造性，它可以做得很好。那么这种条件下人去做什么?人就是要去做创新性的、创造性的工作，包括艺术、创意这样真正叫无中生有，也就是客观世界里没有，只存在于人的这个脑海当中的东西。起码到现在，不能够说ChatGPT能替代人。所以这方面呢，我觉得它其实反倒会引起我们的反思，我们的优势到底是在哪里。也可以反过来去推动我们在这方面的研究，就是人类的这个创造性思维到底是从哪来的?是逻辑的推理、是现实的观察，还有可能是个人的顿悟，这样的一些思维的涌现究竟是如何发生的?所以，我觉得可能将来它反倒会打开这个空间，让我们去研究人的思维和创意。

　　彭敏：“有没有胡说八道”主要是看它的知识点和计算能力有没有到这个层面。为什么知道是胡说八道的话他还会讲?因为他不知道是错的，这一模型缺乏可解释性和验证性。这也是在这10年深度学习出现以后，许多研究者一直在努力做的工作。

　　李祖超：ChatGPT本质上依托于一个参数量巨大的神经网络模型，其训练过程是基于网上现有的语料进行的，而这些训练数据本身良莠不齐，并不全都是优质文本，因此有可能出现事实性错误问题。此外，ChatGPT给出的答案只是基于其理解生成的最佳结果，然而对于某些训练的知识盲区问题，且可能根据字面意思进行推理，从而出现了“一本正经胡说八道”的现象。此外，自然语言理解困难之一是语境问题，由于缺乏上下文可能导致的对问题本身的不理解等，也会导致ChatGPT给出错误的结果。对于常识偏差的问题，这是由于ChatGPT是基于对大量文本进行预训练，而常识(比如太阳比月亮大)通常不会直接包括在这些文本中，因此缺乏对常识的理解。

　　多国高校出台ChatGPT禁令，专家们怎么看?

　　从长期来看不能简单地“一禁了之”，更重要的是探讨怎么去诚信、客观、正面地使用它。

　　梁正：对于科学研究也好，对于内容创作也好，我们要承认他是能够给我们带来很大的这种帮助的。那么，作为一个好的工具，你为什么不去使用它呢?明明他可以给你很大的这方面的一些便利，包括在文献、资料、信息的搜集和整理上。我个人的观点目前高校对ChatGPT的禁令主要是基于公平性的考虑，从长期来看不能简单地“一禁了之”，更重要的是探讨怎么去诚信、客观、正面地使用它。

　　彭敏：我们要用一种开放的心态去接受新事物，而且要把它用到我们能用的极致。当然，我们不能过度地去信任这个工具，还得给它配套必要的措施。

　　ChatGPT给我们带来震撼的同时还带来了哪些思考?

　　随着人工智能不断渗透到人类的生活中，相应的道德和法律规范也应该随之健全。

　　对中国未来的人工智能领域有何展望?

　　李祖超：在启发层面，以ChatGPT为代表的人工智能技术的发展确实是迈出了很大的一步。在未来，这样的技术还有着无限的发展潜力，我们的日常生活也会随之而慢慢发生改变。随着人工智能的发展，人工智能可以代替人类进行各种作业，我们未来在生活中应该更好地借助人工智能的力量来进行发展，而不是过度依赖人工智能的能力而丧失我们原有的能力。同时，人类作为人工智能创意的来源，持续不断的新的创意养料才能帮助人工智能迭代，因此未来的高价值职业都会向高创意方向发展。最后，随着人工智能不断渗透到人类的生活中，相应的道德和法律规范也应该随之健全。

　　对中国未来的人工智能领域有何展望?

　　未来，我们应该坚持在产业、人才、创新创业环境等持续投入，不仅仅要做突破，更要探讨我们在数字化转型中的潜力和活力。

　　梁正：近年来，我国在人工智能领域基础研究、技术平台、行业应用等多方面都有布局。人工智能领域的创新创业活跃度很高。未来，我们应该坚持长期主义，产业、人才、创新创业环境等持续投入，不仅仅要做突破，更要探讨我们在数字化转型中的潜力和活力。

　　彭敏：我国人工智能领域应该从全局角度入手进行规划，在通用大模型基础上再落地到下游垂直领域场景。希望未来国家关于人工智能的规划能有所调整，做全局性部署。

　　李祖超：中国未来人工智能领域的发展目标之一是需要追平代差。此外，由于通用人工智能技术不仅仅包含语言智能，也包含语音智能和视觉智能等，因此下一代ChatGPT技术应当是多模态的，未来人工智能领域也将着眼于多模态ChatGPT的研发当中。