摘要:在科幻电影的奇妙世界里,常常出现一些令人深思的场景。就像钢铁侠的战甲,它总能代替托尼・斯塔克与他人交流,在《钢铁侠 3》中,女主角小辣椒长时间与战甲对话后,才惊觉托尼本人并不在里面,同样,在《蜘蛛侠返校日》里,蜘蛛侠帕克也没能分辨出战甲中是否有托尼。
在科幻电影的奇妙世界里,常常出现一些令人深思的场景。就像钢铁侠的战甲,它总能代替托尼・斯塔克与他人交流,在《钢铁侠 3》中,女主角小辣椒长时间与战甲对话后,才惊觉托尼本人并不在里面,同样,在《蜘蛛侠返校日》里,蜘蛛侠帕克也没能分辨出战甲中是否有托尼。
这些情节不禁让我们思考一个问题:一旦人工智能和真实的人类无法被分辨,是否就意味着人工智能已经达到了真正的智能呢?
图灵
早在 1950 年,被誉为 “人工智能之父” 的图灵就提出了著名的图灵测试。这一测试旨在为判断计算机是否具有人类的思维能力提供一种方法,也成为了后来人们探索人工智能发展程度的重要参照。
那么图灵测试究竟是怎样的一种测试呢?它是在不接触对方的情况下,通过特殊方式和对方进行一系列问答。1952 年,在一场 BBC 的广播中,图灵谈到了一个更为具体的操作办法,即将人与机器隔离开,人通过一些装置,比如键盘向机器提问。经过多次提问后,如果超过 30% 的人,不能够确定出被测试者是人还是机器,那么这台机器就通过了测试,并被认为具有了人类的智能。
从此,这 30% 的标准便成为了图灵测试的及格线。虽然从数值上来看,这个及格线并不算高,但它直到今天仍然被作为检验人工智能的标准之一,在人工智能发展的漫长历程中有着举足轻重的地位。
时光流转,到了 2014 年 6 月 7 日,在英国皇家学会举行的 2014 图灵测试大会上,出现了一个引人瞩目的事件。俄罗斯科学家开发的聊天程序尤金・古斯特曼,它冒充一个 13 岁的乌克兰男孩,成功骗过了 1/3 的评委,按照图灵当初的定义,尤金通过了图灵测试,成为了有史以来首台通过该测试的计算机。
然而,这并不意味着它真的具备了和人类一样的人工智能。图灵测试的核心准则是计算机在智力行为上表现得和人无法区分,但实际测试时,程序的设计者往往会去寻找规则的漏洞,让计算机在对话中骗过人类,而非让其真正拥有相当水平的智能。
比如在与尤金对话时,当被问到 “一头骆驼有几条腿?” 这样一个常识性问题时,尤金的回答却是 “两条到 4 条,也许是 3 条。顺便说一句,我还是不知道你的专业是什么,或者我刚才没有看到”,它通过询问测试者的专业来转移话题,也就是我们常说的顾左右而言他。
网友们还总结出通过图灵测试的三字箴言 “呆、萌、傻”,意思是把程序伪装成一个来自偏远地区、没怎么接受过教育的小孩子,以此降低测试者对智能水平和知识积累程度的要求,进而提高通过测试的可能性,尤金就是把自己伪装成乌克兰奥德萨、母语不是英语的 13 岁男孩,来为自己不专业的回答找理由。
如今,我们生活中实用的人工智能产品,像微软小冰、苹果 Siri、小度、小爱同学等,都只是实现了弱人工智能。它们主要是靠凑答案,准备大量标注好的数据,然后用众多机器进行快速检索,把答案拼凑得差不多就行,对于问题的内在逻辑和简约的规律,目前的人工智能既无心顾及,也无力解读。
而且计算机程序为了迷惑提问者,有着不少 “小手段”。一方面,它们可以用背景知识来回避问题,或者故意不好好回答,避免测试者发现回答的套路;另一方面,还能有意无意地保持沉默来混淆判断。
但人类也可以通过一些涉及常识以及代词回指等语言现象的问题来难倒计算机程序,因为人类日常对话包含诸多常识,应答者需要对人类语言细微之处和人类社交习惯本质有深刻理解,这目前很难用计算机程序去描述。
另外,图灵测试不光在高大上的科学研究中有应用,在生活中也有简单的体现,比如验证码,它其实就是一种简单化的图灵测试,有着一个充满科学气息的名称 —— 全自动区分电脑和人类的图灵测试,被广泛应用于网络购物验证登录等场景,用于区分操作者是人还是机器,是一场机器向人提问的反图灵测试。
不过,随着年代和技术不断发展,图灵测试本身也有着局限性。我们设想一下,如果一台计算机真的拥有了与人类相近的智能水平,它会不会故意把自己伪装起来,让自己通不过图灵测试呢?倘若人类一味将图灵测试当作唯一的判别标准,当人工智能发展到更高程度而我们却未察觉时,也许会出现故意不通过图灵测试的人工智能,而一旦这样的情况发生,对于人类来说,后果或许不堪设想。
总之,图灵测试在人工智能发展道路上有着重要意义,但我们也要清醒地认识到它的局限以及人工智能目前的真实发展状态,继续探索这一充满魅力又蕴含挑战的领域。
来源:贾老师说的不假