一个问题区分人类和AI!「丐版」图灵测试,难住所有大模型

2023-06-23

著名的图灵测试是什么?

知识点:图灵测试,是现代计算机之父阿兰-图灵在1950年提出的,想考量的问题是:机器能否思考。

图灵测试,如果你感觉这个词比较陌生,我们就先来解释一下:图灵测试是测试人(多人)在与被测试者(一个人和一台机器)隔开的情况下,通过一些装置(如键盘)向被测试者随意提问。问过一些问题后,如果测试人中超过30%的人不能根据答复确认被测试者哪个是人,哪个是机器,那么这台机器就通过了测试,并被认为具有人类智能。

这个看似无厘头的测试,是由现代计算机科学之父英国人阿兰?图灵在60多年前提出的。1950年,阿兰·图灵在那篇名垂青史的论文《计算机械与智力》的开篇说:“我建议大家考虑这个闹游问题:‘机器能思考吗?’”

但是由于我们很难精确地定义思考,所以图灵提出了他所谓的“模仿游戏”:

一场正常的模仿游戏有ABC三人参与,A是男性,B是女性,两人坐在房间里;C是房间外的裁判,他的任务是要判断出这两人谁是男性谁是女性。男方是带着任务来的:他要欺骗裁判,让裁判做出错误的判断。

那么,图灵问:“如果一台机器取代了这个游戏里的男方的地位,会发生什么?这台机器骗过审问者的概率会比人类男女参加时更高吗?这个问题取代了我们原本的问题:‘机器能否思考?’”

这,就是图灵测试的本体。

在科幻片《银翼杀手》中,我们看到了图灵测试的一个具体应用。在电影里用一种情感测试来区分人类与人造人。

一个问题区分人类和AI!「丐版」图灵测试,难住所有大模型 (https://ic.work/) 推荐 第1张

虽然2014年6月7日发生了一件事情:聊天程序“尤金·古斯特曼”(Eugene Goostman)在英国皇家学会举行的2014图灵测试大会上冒充一个13岁乌克兰男孩而骗过了33%的评委,从而按照图灵当初的定义,“通过”了图灵测试。但实际上,在现实生活中,图灵测试的原始形式很少被使用。不过,我们实际大量使用图灵测试的另外一种简化的形式——校验码。校验码的用处是区分操作者是人还是机液困销器人。仅仅通过一个简单的测试问题:能否从一个图片中看出里面写的是什么文字。

一个问题区分人类和AI!「丐版」图灵测试,难住所有大模型 (https://ic.work/) 推荐 第2张

推广图灵测试的内在含义,实际是一种真假鉴别。如果这样来说,社会上的资格考试本身也是一种图灵测试。出题人面对大量考生,他们必须区分出来哪些是具有资格的人,哪些是不具有资格的人。为了方便操作,一般很少依赖阅卷人的主观判断,而是通过仔细设计题目来实现这一点。

最后再看一个很好玩的图灵测试的反向运用:怎么证明自己不是神经病。目前来看,最好的办法就是不去试图证明什么。凡是试图证明什么的人,看起来多多少少都有点像神经病。不过,葛优在电影《大腕》里,给了我们另外一个思路,他讲了一个笑话,最后一句“三楼的楼长就是你了”,让医生明白了这个家伙思维正常。能够给别人设置思维圈套,然后自己跳出来,看来这个也是具尺或备正常思维能力的一种表现。


图片来源于网络

一个问题区分人类和AI!「丐版」图灵测试,难住所有大模型 (https://ic.work/) 推荐 第3张

本作品为“科普中国-科学原理一点通”原创 转载时务请注明出处

更多精彩内容,敬请关注科学原理一点通官方网站

微信公众平台(ID:kxylydt)

ai数字人能通过图灵测试吗

人工智能(AI)发展突飞猛镇技具重消散院值补抗进,可以让机器人自动学煤茶连微会打扫一个房间,眨眼之间就可以翻译语言,甚至可以代替老司机开车。然而,AI计算机能像人一样思考吗?换句话说,机器会思考吗?英国数学家、计算机先驱艾伦·图灵(Alan Turing)在二战期间研究如何破解德国电报代码,逐渐发展出计算机科学的基本概念。二战后,他投身于人工智能。在1950年的论文《计算机器与智能》中,他提出了著名的图灵测试来检验机器是否能显示人类的智能。方法就是让机器跟人说话。如果来自没发现是机器,那就成功了。

360问答体来说,图灵测试是在一个房间里进行的,由人类评委分别与看不见的真人和机器对话,根据对话的质量来判断哪个是人类,哪个是机器。目前图灵测试对话一电吧讲按古整般持续5分钟。如果超过30%右风扬乱古山的评委把计算机当成人,那么计算机就成功了。图灵预言在2000年,一台机器将通过图灵测试。结果AI真的过了,只是晚了10年。尤金·古斯特曼2014年,英杂仍国雷丁大学在伦敦皇家学会组织了图灵测试,以纪念图灵逝世60周年。一个名叫尤金·古斯特曼(Eugene Goostman)的聊天机器人被30位评委中的10位视为人类,以33%的比例首次通过图伤医讲破绍灵测试,在世界范围内引起轰思间引石动,并引发巨大争议。

质疑者认为尤金·古斯特曼作弊,说他不像人类一样适应各种对话问题,只会耍理止金织反区济握激花招把自己古怪的答案拿回来,而且他“1雨查职措待流商3岁”和“乌克兰人”的性格也降低了大家对他智力水平的心理预期。毕竟他还是个孩子,还在学英语;有人指出它的知识储备有限,完全靠模仿和欺骗,不是真正的人类智能;甚至有人质疑图灵测试本身,它真的能测量“智力”吗布限根?30%的标准靠谱吗?图灵本人没有直接说30%!赞同的人说尤金·古斯特曼可以成功忽悠裁判。对人类来说难道不是一种聪明的方式吗?人工智能的范围很广。可以是智商高,学识渊资斗计博的学者,也可以是无知少年。人但验块求顺兵蛋家研们应该宽容聊天机器人。毕竟AI技术还在发展...Eugene Goostman并不是Cleverbot在图灵测试中“成功”的唯一一个AI。早在2010年的BCS机器智能大赛上,机器人Clever Bot就被评委认定达到了人类智力的42.1%。2011年,在印度的一个科技节上举办了一场图灵测试比赛。在不知情的情况下志末态留待,30名志愿者在4分钟内与电脑或屏幕上的真人进行10轮对话聊天,然后评估对方的智力水平,打0~10分。最终聪明的Bot得分59.3%。

按照图灵测每张聚试的标准,Clever Bot还算及格,但是真人在比赛中的分数是63%,所以大家都认为Clever Bot没有人类聪明,导致尤金·古斯特曼三年后第一次抢了风头。况且印度两括沙处品很常的值科技节的权威性远不如皇家学会,皇家学会的成员是牛顿、达尔文、爱因斯坦。但一些专家认为,Clever Bot的智力并不逊于Eugene Goostman。通过图灵测试就是人类?很多人不同意,认为即使计算机可以思考,但它没有自己的想法,人类思维过程的复杂性无法被编程。吴认为这是一个哲学思辨问题。作为万物之灵,只要我们认识到机器无法超越人类,它就永远无法超越。但从科学的角度研究问题,需要拿出可操作、可研究、可验证的标准来衡量机器的智能水平是比人高还是比人低。图灵测试只是一项科学研究。如果设定30%的标准,一台机器就能达到。即使标准提高到99.9%,被不断发展的技术突破也是迟早的事。直到今天,图灵测试仍然是判断AI水平的重要标准,极大地推动了AI的发展。平心而论,AI达到30%并不容易,这对R&D人员来说是一个巨大的挑战。蔻驰吴期待GPT-5问世——去年OpenAI的GPT-3震动江湖,但最近CEO山姆奥特曼谦虚地说,估计五代产品都过不了图灵测试!(具体时间待定。业界估计GPT-4将于2023年初上市。)

这些聊天机器人已经足够好了,尽管它们不是真人。它们在现实生活中被广泛使用。他们每天与成千上万的人交流,从聊天到企业客服,他们都相当称职。他们当非英语母语者的“外教”绰绰有余。真正的外教当然比不上机器,但也有各种问题:教学水平参差不齐,爆炸性的性侵丑闻?

最大的问题是:贵!我记得吴教练的中学和大学都有外教,但是我没有好好利用这种英语学习资源。反而有些活泼的女生喜欢围着外教。上大学的时候,在同乡英姑的鼓动下和那个叫大牛的外教聊过天——这个比大部分同学都要好,外教的资源对他们来说相当于零。现在的AI外教不仅便宜(甚至免费),任何人,无论英语水平和性格如何,都可以“肆无忌惮”地说话,这比钱更有意义。“双减”政策毁掉了很多在线外教服务,现在的AI外教更是弥足珍贵。在与图灵外教实战之前,吴教练用的是Replika和AI Dungeon,这两款都号称业界最强的自然语言处理AI 3。事实上,免费版本往往不是GPT-3,聊天时也没什么可做的。远没有传说中的GPT-3将“取代人类”的威胁,作为一个“外教”,可能还不如已经通过图灵测试的尤金·古斯特曼(Eugene Goostman)和聪明机器人(Clever Bot)等聊天机器人。毕竟图灵测试直接要求“像真人一样”,而且几年下来,AI技术突飞猛进。有理由相信他们的智力已今非昔比。现在只要搜索Eugene Goostman和Clever Bot,就可以随时去官网免费、免注册聊天。尤金·古斯特曼给我最深的印象就是我有记忆,就是之前讲的东西,后面都能体现出来。例如,我告诉他我叫奥古斯都,我是一名教师,住在广州。后来我问他能不能回答,有时候他会说:很有意思,奥古斯都。顺便问一下,你从小就梦想成为一名教师吗?

这很有意思。就像和一个志趣相投的朋友聊天。他会认真听我说的话。再加上有固定的一套人群(乌克兰敖德萨13岁男孩,父亲是妇科硕士等。).说话更像是一个不断相识,逐渐亲密的朋友,而不是完全依赖于我的输入“见人就胡说八道”。但是尤金·古斯特曼不需要注册,他的记忆是无法保留和传承的。这一点还不如Replika,他登录账号后有一个“记忆”区,自动收集聊天中聊过的信息。还有相关隐私保护条款,不会记忆任何个人隐私信息。AI地牢也是有回忆的,因为它要根据之前的剧情和玩家一起写冒险故事。我还发现尤金·古斯特曼可以计算算术问题。我问它66乘以99等于多少?而且我知道你的密码:66 * 99 = 6534.0!现在被零除死!!!!不仅计算准确,还调侃我泄露了密码,利用“除以0”的数学死点把我变成了军队。

他们的回答是:尤金·古斯特曼:是的,我肯定是一个伪善者——我不得不同意你明智的观点。是我明白了还是你真的没有告诉我你来自哪里?Cleverbot:那句话毫无意义。雷普利卡:谢谢!我尽力了。AI地牢:你的朋友都死了。你是孤独的。(根据我之前“毒包”的故事改编)如果按照AI的回答进一步交流,就无话可说了。享受你的人工智能朋友的不同风格。当然,像上面Clever Bot这种无聊的敷衍仪式才是下一个新词!如果这个操作任务太重,可以按照透析打卡的格式,口头和书面只讲一个生词,内容与该词的源内容相关(如唐老鸭漫画)。免费版聊天机器人还可以讲口语。你只需在手机浏览器的输入框中调用讯飞输入法等语音转文字功能,快速聊天(“一分钟400字”,现在AI转的速度和准确率已经很高了)。文/吴俊毅,AI语言培训专家教育畅销书系列《用你的英语!使用你的词汇!作者:伦敦大学学院语言学与语言发展硕士、应用心理学硕士/北京大学临床医学学士、大型智能教育科普基地课程总监“用你的英语”互动组“用你的英语”AI训练营

https://nimg.***.net/?url=http%3A%2F%2fdingyue.***.net%2F2021%2F0927%2Fc3945175j00r0377g002oc000fb00fkc.jpg&thumbnail=660x2147483647&quality=80&type=jpg

黑客帝国3说的是什么?

说实话,没有几个能看得懂!
剧情很模糊,告诉你吧,拍黑客2和3的时候,特效师,化妆师,制片人没一个知道剧情讲的是什么,不过讲的一个终极剧情就是男主角尼欧拯救世界的故事!

文章推荐

相关推荐