ChatGPT在图灵测试研究中败给上世纪60年代的计算机程序 ELIZA(图灵测试软件)

来源：网络　浏览：49次　时间：2023-12-08

12月8日消息:近日，加利福尼亚大学圣迭戈分校的研究人员进行了一项有趣的实验，将上世纪60年代的计算机程序ELIZA与现代AI聊天机器人ChatGPT进行了图灵测试比较。该研究引发了对OpenAI的尴尬评价，认为ELIZA在这一测试中表现得更为出色。

图灵测试是评估计算机是否能够模拟人类对话的标准，由英国计算机科学家艾伦·图灵于1950年首次提出。在这项最新研究中，研究人员邀请了652名参与者，通过互联网判断他们是在与另一个人还是与AI聊天机器人交流。

结果显示，ELIZA成功模拟人类的能力达到27%，而OpenAI的GPT-3.5仅为14%。引起尤为注目的是，OpenAI的更强大版本GPT-4在测试中的成功率为41%，超过了ELIZA。

对此，AI专家Gary Marcus形容ELIZA的成功对现代科技公司开发AI聊天机器人是一种“尴尬”。然而，一些学者认为，ChatGPT并非被设计用于在图灵测试中表现优异。

美国宾夕法尼亚大学沃顿商学院的AI教授Ethan Mollick在社交媒体上发文表示:“我认为GPT-3.5输给ELIZA并不令人惊讶，当你读完论文后就会明白。OpenAI一直认为模仿风险是一个真正的问题，并采用了RLHF（从人类反馈中进行强化学习），以确保ChatGPT不会试图冒充人类。而ELIZA则更多地是通过利用我们的心理来成功冒充。”

研究中提到，参与者误认ELIZA为人类的原因之一是ELIZA“太糟糕”，以至于被认为是当前AI模型无法达到的水平，因此“更有可能是有意不合作的人类”。

普林斯顿大学计算机科学教授Arvind Narayanan指出:“一如既往，测试行为并不能告诉我们关于能力的信息。ChatGPT被调整为具有正式的语气，不表达观点等，这使得它不太像人类。”

这项名为“GPT-4是否通过图灵测试”的研究尚未经过同行评审。这一发现引发了对现代AI聊天机器人设计和性能的深入思考。

推荐站点

零目录
零目录（www.dir0.com）专业的网站分类目录平台！为您提供网站分类目录索引及网址大全库的建立，是目前较为专业的网站分类目录平台，为用户打造大型正规分类目录网，提供高效便捷的网址存储和查询服务的分类目录网站。
www.dir0.com
YY分类目录
YY分类目录全人工编辑的开放式网站分类目录，收录国内外、各行业优秀网站，旨在为用户提供网站分类目录检索、优秀网站参考、网站推广服务。
www.yydir.com
名人百科网
名人百科网(mrenbaike.net)--为大家提供各行各业的名人资料、资讯、图片等,致力于打造国内专业的名人百科平台！
www.mrenbaike.net
菜鸟教程
菜鸟教程提供了基础编程技术教程。菜鸟教程的 Slogan 为：学的不仅是技术，更是梦想！记住：再牛逼的梦想也抵不住傻逼似的坚持！本站域名为 runoob.com, runoob 为 Running Noob 的缩写，意为：奔跑吧！菜鸟。本站包括了HTML、CSS、Javascript、PHP、C、Python等各种基础编程教程。同时本站中也提供了大量的在线实例，通过实例，您可以更好地学习如何建站。本站致力于推广各种编程语言技.
www.runoob.com
中国社会公益网
陕西省社会公益基金会是经陕西省民政厅批准的公募基金会，下设秘书处、公益项目部、筹款募捐部、宣传策划部、社会活动部、专项基金部、资金管理部、公关联络部、青年志愿者工作委员会、青年志愿者爱心乐团等部门机构
www.cpf.net.cn
CNMO科技新媒体
CNMO=Connect More,致力于通过内容成为人与科技、人与产品、人与品牌、人与服务对接的桥梁,让产业、产品的价值与服务得到专业且有趣的解读和适配,引领用户畅享科技带来的美好生活!
www.cnmo.com
国外主机测评
国外主机测评，国外VPS、云服务器，国外服务器，国外主机的相关优惠信息、商家背景、网络带宽、线路走法、售前和售后技术支持等，是目前最好的一家国外主机评测平台。
www.zhujiceping.com
赵容部落
赵容部落，一个收集国内，国外便宜主机，VPS，云服务器，独立服务器优惠促销信息，提供VPS新手教程，VPS评测，VPS代购代付服务的博客。
www.zrblog.net
老左博客
老左博客，致力于美国VPS，美国主机评测、推荐；分享便宜VPS，美国主机优惠码，Godaddy优惠码，NameCheap等域名优惠码的IT博客，博主老左(LaoZuo.ORG)。
www.laozuo.org

ChatGPT在图灵测试研究中败给上世纪60年代的计算机程序 ELIZA(图灵测试软件)

推荐文章

推荐站点