一个问题区分人类和AI！「丐版」图灵测试，难住所有大模型

著名的图灵测试是什么？

知识点：图灵测试，是现代计算机之父阿兰-图灵在1950年提出的，想考量的问题是：机器能否思考。

图灵测试，如果你感觉这个词比较陌生，我们就先来解释一下：图灵测试是测试人(多人)在与被测试者(一个人和一台机器)隔开的情况下，通过一些装置(如键盘)向被测试者随意提问。问过一些问题后，如果测试人中超过30%的人不能根据答复确认被测试者哪个是人，哪个是机器，那么这台机器就通过了测试，并被认为具有人类智能。

这个看似无厘头的测试，是由现代计算机科学之父英国人阿兰?图灵在60多年前提出的。1950年，阿兰·图灵在那篇名垂青史的论文《计算机械与智力》的开篇说：“我建议大家考虑这个闹游问题：‘机器能思考吗？’”

但是由于我们很难精确地定义思考，所以图灵提出了他所谓的“模仿游戏”：

一场正常的模仿游戏有ABC三人参与，A是男性，B是女性，两人坐在房间里；C是房间外的裁判，他的任务是要判断出这两人谁是男性谁是女性。男方是带着任务来的：他要欺骗裁判，让裁判做出错误的判断。

那么，图灵问：“如果一台机器取代了这个游戏里的男方的地位，会发生什么？这台机器骗过审问者的概率会比人类男女参加时更高吗？这个问题取代了我们原本的问题：‘机器能否思考？’”

这，就是图灵测试的本体。

在科幻片《银翼杀手》中，我们看到了图灵测试的一个具体应用。在电影里用一种情感测试来区分人类与人造人。

虽然2014年6月7日发生了一件事情：聊天程序“尤金·古斯特曼”(Eugene Goostman)在英国皇家学会举行的2014图灵测试大会上冒充一个13岁乌克兰男孩而骗过了33%的评委，从而按照图灵当初的定义，“通过”了图灵测试。但实际上，在现实生活中，图灵测试的原始形式很少被使用。不过，我们实际大量使用图灵测试的另外一种简化的形式——校验码。校验码的用处是区分操作者是人还是机液困销器人。仅仅通过一个简单的测试问题：能否从一个图片中看出里面写的是什么文字。

推广图灵测试的内在含义，实际是一种真假鉴别。如果这样来说，社会上的资格考试本身也是一种图灵测试。出题人面对大量考生，他们必须区分出来哪些是具有资格的人，哪些是不具有资格的人。为了方便操作，一般很少依赖阅卷人的主观判断，而是通过仔细设计题目来实现这一点。

最后再看一个很好玩的图灵测试的反向运用：怎么证明自己不是神经病。目前来看，最好的办法就是不去试图证明什么。凡是试图证明什么的人，看起来多多少少都有点像神经病。不过，葛优在电影《大腕》里，给了我们另外一个思路，他讲了一个笑话，最后一句“三楼的楼长就是你了”，让医生明白了这个家伙思维正常。能够给别人设置思维圈套，然后自己跳出来，看来这个也是具尺或备正常思维能力的一种表现。

图片来源于网络

本作品为“科普中国-科学原理一点通”原创转载时务请注明出处

更多精彩内容，敬请关注科学原理一点通官方网站

微信公众平台（ID：kxylydt）

ai数字人能通过图灵测试吗

人工智能(AI)发展突飞猛镇技具重消散院值补抗进，可以让机器人自动学煤茶连微会打扫一个房间，眨眼之间就可以翻译语言，甚至可以代替老司机开车。然而，AI计算机能像人一样思考吗？换句话说，机器会思考吗？英国数学家、计算机先驱艾伦·图灵(Alan Turing)在二战期间研究如何破解德国电报代码，逐渐发展出计算机科学的基本概念。二战后，他投身于人工智能。在1950年的论文《计算机器与智能》中，他提出了著名的图灵测试来检验机器是否能显示人类的智能。方法就是让机器跟人说话。如果来自没发现是机器，那就成功了。

具360问答体来说，图灵测试是在一个房间里进行的，由人类评委分别与看不见的真人和机器对话，根据对话的质量来判断哪个是人类，哪个是机器。目前图灵测试对话一电吧讲按古整般持续5分钟。如果超过30%右风扬乱古山的评委把计算机当成人，那么计算机就成功了。图灵预言在2000年，一台机器将通过图灵测试。结果AI真的过了，只是晚了10年。尤金·古斯特曼2014年，英杂仍国雷丁大学在伦敦皇家学会组织了图灵测试，以纪念图灵逝世60周年。一个名叫尤金·古斯特曼(Eugene Goostman)的聊天机器人被30位评委中的10位视为人类，以33%的比例首次通过图伤医讲破绍灵测试，在世界范围内引起轰思间引石动，并引发巨大争议。

质疑者认为尤金·古斯特曼作弊，说他不像人类一样适应各种对话问题，只会耍理止金织反区济握激花招把自己古怪的答案拿回来，而且他“1雨查职措待流商3岁”和“乌克兰人”的性格也降低了大家对他智力水平的心理预期。毕竟他还是个孩子，还在学英语；有人指出它的知识储备有限，完全靠模仿和欺骗，不是真正的人类智能；甚至有人质疑图灵测试本身，它真的能测量“智力”吗布限根？30%的标准靠谱吗？图灵本人没有直接说30%！赞同的人说尤金·古斯特曼可以成功忽悠裁判。对人类来说难道不是一种聪明的方式吗？人工智能的范围很广。可以是智商高，学识渊资斗计博的学者，也可以是无知少年。人但验块求顺兵蛋家研们应该宽容聊天机器人。毕竟族AI技术还在发展...Eugene Goostman并不是Cleverbot在图灵测试中“成功”的唯一一个AI。早在2010年的BCS机器智能大赛上，机器人Clever Bot就被评委认定达到了人类智力的42.1%。2011年，在印度的一个科技节上举办了一场图灵测试比赛。在不知情的情况下志末态留待，30名志愿者在4分钟内与电脑或屏幕上的真人进行10轮对话聊天，然后评估对方的智力水平，打0~10分。最终聪明的Bot得分59.3%。

按照图灵测每张聚试的标准，Clever Bot还算及格，但是真人在比赛中的分数是63%，所以大家都认为Cl移ever Bot没有人类聪明，导致尤金·古斯特曼三年后第一次抢了风头。况且印度两括沙处品很常的值科技节的权威性远不如皇家学会，皇家学会的成员是牛顿、达尔文、爱因斯坦。但一些专家认为，Clever Bot的智力并不逊于Eugene Goostman。通过图灵测试就是人类？很多人不同意，认为即使计算机可以思考，但它没有自己的想法，人类思维过程的复杂性无法被编程。吴认为这是一个哲学思辨问题。作为万物之灵，只要我们认识到机器无法超越人类，它就永远无法超越。但从科学的角度研究问题，需要拿出可操作、可研究、可验证的标准来衡量机器的智能水平是比人高还是比人低。图灵测试只是一项科学研究。如果设定30%的标准，一台机器就能达到。即使标准提高到99.9%，被不断发展的技术突破也是迟早的事。直到今天，图灵测试仍然是判断AI水平的重要标准，极大地推动了AI的发展。平心而论，AI达到30%并不容易，这对R&D人员来说是一个巨大的挑战。蔻驰吴期待GPT-5问世——去年OpenAI的GPT-3震动江湖，但最近CEO山姆奥特曼谦虚地说，估计五代产品都过不了图灵测试！(具体时间待定。业界估计GPT-4将于2023年初上市。)

这些聊天机器人已经足够好了，尽管它们不是真人。它们在现实生活中被广泛使用。他们每天与成千上万的人交流，从聊天到企业客服，他们都相当称职。他们当非英语母语者的“外教”绰绰有余。真正的外教当然比不上机器，但也有各种问题:教学水平参差不齐，爆炸性的性侵丑闻?

最大的问题是:贵！我记得吴教练的中学和大学都有外教，但是我没有好好利用这种英语学习资源。反而有些活泼的女生喜欢围着外教。上大学的时候，在同乡英姑的鼓动下和那个叫大牛的外教聊过天——这个比大部分同学都要好，外教的资源对他们来说相当于零。现在的AI外教不仅便宜(甚至免费)，任何人，无论英语水平和性格如何，都可以“肆无忌惮”地说话，这比钱更有意义。“双减”政策毁掉了很多在线外教服务，现在的AI外教更是弥足珍贵。在与图灵外教实战之前，吴教练用的是Replika和AI Dungeon，这两款都号称业界最强的自然语言处理AI 3。事实上，免费版本往往不是GPT-3，聊天时也没什么可做的。远没有传说中的GPT-3将“取代人类”的威胁，作为一个“外教”，可能还不如已经通过图灵测试的尤金·古斯特曼(Eugene Goostman)和聪明机器人(Clever Bot)等聊天机器人。毕竟图灵测试直接要求“像真人一样”，而且几年下来，AI技术突飞猛进。有理由相信他们的智力已今非昔比。现在只要搜索Eugene Goostman和Clever Bot，就可以随时去官网免费、免注册聊天。尤金·古斯特曼给我最深的印象就是我有记忆，就是之前讲的东西，后面都能体现出来。例如，我告诉他我叫奥古斯都，我是一名教师，住在广州。后来我问他能不能回答，有时候他会说:很有意思，奥古斯都。顺便问一下，你从小就梦想成为一名教师吗？

这很有意思。就像和一个志趣相投的朋友聊天。他会认真听我说的话。再加上有固定的一套人群(乌克兰敖德萨13岁男孩，父亲是妇科硕士等。).说话更像是一个不断相识，逐渐亲密的朋友，而不是完全依赖于我的输入“见人就胡说八道”。但是尤金·古斯特曼不需要注册，他的记忆是无法保留和传承的。这一点还不如Replika，他登录账号后有一个“记忆”区，自动收集聊天中聊过的信息。还有相关隐私保护条款，不会记忆任何个人隐私信息。AI地牢也是有回忆的，因为它要根据之前的剧情和玩家一起写冒险故事。我还发现尤金·古斯特曼可以计算算术问题。我问它66乘以99等于多少？而且我知道你的密码:66 * 99 = 6534.0！现在被零除死！！！！不仅计算准确，还调侃我泄露了密码，利用“除以0”的数学死点把我变成了军队。

他们的回答是:尤金·古斯特曼:是的，我肯定是一个伪善者——我不得不同意你明智的观点。是我明白了还是你真的没有告诉我你来自哪里？Cleverbot:那句话毫无意义。雷普利卡:谢谢！我尽力了。AI地牢:你的朋友都死了。你是孤独的。(根据我之前“毒包”的故事改编)如果按照AI的回答进一步交流，就无话可说了。享受你的人工智能朋友的不同风格。当然，像上面Clever Bot这种无聊的敷衍仪式才是下一个新词！如果这个操作任务太重，可以按照透析打卡的格式，口头和书面只讲一个生词，内容与该词的源内容相关(如唐老鸭漫画)。免费版聊天机器人还可以讲口语。你只需在手机浏览器的输入框中调用讯飞输入法等语音转文字功能，快速聊天(“一分钟400字”，现在AI转的速度和准确率已经很高了)。文/吴俊毅，AI语言培训专家教育畅销书系列《用你的英语！使用你的词汇！作者:伦敦大学学院语言学与语言发展硕士、应用心理学硕士/北京大学临床医学学士、大型智能教育科普基地课程总监“用你的英语”互动组“用你的英语”AI训练营

https://nimg.***.net/?url=http%3A%2F%2fdingyue.***.net%2F2021%2F0927%2Fc3945175j00r0377g002oc000fb00fkc.jpg&thumbnail=660x2147483647&quality=80&type=jpg

黑客帝国3说的是什么？

说实话，没有几个能看得懂！
剧情很模糊，告诉你吧，拍黑客2和3的时候，特效师，化妆师，制片人没一个知道剧情讲的是什么，不过讲的一个终极剧情就是男主角尼欧拯救世界的故事！

一个问题区分人类和AI！「丐版」图灵测试，难住所有大模型

著名的图灵测试是什么？

ai数字人能通过图灵测试吗

黑客帝国3说的是什么？

相关推荐

芯驰科技与Arteris深化合作

戴尔PowerEdge R770服务器的性能测试

光庭信息与芯驰科技签署战略合作协议

京东方发布2025年第一季度报告

中科曙光DeepAI深算智能引擎全面支持Qwen3

中微爱芯亮相第21届家电电源与智能控制技术研讨会

中科曙光亮相第八届数字中国建设峰会

RDK全系赋能！点猫科技与地瓜机器人共建具身智能大中小贯通培养闭环要闻

魔视智能携手德州仪器亮相2025慕尼黑上海电子展

曙光存储亮相2025 IT市场年会

推荐

黄仁勋中国行的背后，AI芯片暗战与英伟达生存博弈

国民技术发布国内首款Arm® Cortex®M7+M4双核异构MCU 面向具身智能机器人

北京机器人传感器公司金钢科技数千万元Pre

光子 AI 处理器的核心原理及突破性进展

TrendForce集邦咨询: 预估2025年笔电品牌出货成长率将下修至1.4%

解决续航、网速痛点，Wi 7 PA杀入AI眼镜

15万车型也能有车规SiC！2025年慕展6家厂商新品亮点大揭秘

让英特尔再次伟大，新CEO推动18A提前量产，14A已在路上

晶振在网通应用增光添彩：中国移动实现数字乡村大升级

一文解析电磁场与电磁波的区别

最近更新