AI通过心理测试，意味着什么？

7 人参与

TOPIC SOURCE

当斯坦福大学的研究人员发现GPT-3.5能够通过经典的心理测试时，整个认知科学领域都感到了微妙的震动。这不仅仅是一个技术突破，更像是在平静湖面投下的一颗石子——涟漪正悄然扩散到人类对自我认知的边界。

在"意外内容测试"中，AI准确判断出角色在看到巧克力包装里装着爆米花时的情绪反应；在"意外转移任务"里，它能理解角色对物体位置的错误信念。这些表现似乎暗示着某种心智理解能力，但关键问题在于：这是真正的认知能力，还是统计模式下的精致模仿？

认知科学家史蒂芬·平克曾指出，人类心智理论是进化形成的专用模块。而大语言模型展现的类似能力，更像是在海量文本训练中形成的统计规律。当模型读到足够多关于"惊讶"、"误解"、"信念"的文本模式时，它学会的是这些概念的关联网络，而非真正的心理状态理解。

这些心理测试最初是为儿童设计的，它们依赖于语言理解和情境模拟。当测试对象变成精通语言模式的大模型时，我们可能需要重新审视这些工具的效度。就像用体温计测量水温——工具本身可能已经不再适用。

麻省理工学院认知科学家劳拉·舒尔茨认为，真正的智能在于灵活适应新情境的能力。GPT-3.5在已知测试模式中表现出色，但面对完全新颖的认知挑战时，其表现就会大幅下降。这种差异揭示了当前AI系统的本质：它们是优秀的模式识别器，而非真正的认知主体。

也许最重要的不是AI能否通过测试，而是这些测试迫使我们必须重新思考：什么是心智？什么是理解？当机器能够模仿人类认知的某些方面时，我们对自己心智的理解也需要更新。

参与讨论

7 条评论