澎湃新闻 尼克2016-03-13 2006年,会议五十年后,当事人重聚达特茅斯。左起:摩尔,麦卡锡,明斯基,赛弗里奇,所罗门诺夫 背景 现在一说起人工智能的起源,公认是1956年的达特茅斯会议。殊不知还有个前戏:1955年,美国西部计算机联合大会(Western Joint Computer Conference)在洛杉矶召开,会中还套了个小会:“学习机讨论会”(Session on Learning Machine)。讨论会的参加者中有两个人参加了第二年的达特茅斯会议,他们是塞弗里奇(Oliver Selfridge)和纽厄尔(Allen Newell),塞弗里奇发表了一篇模式识别的文章,而纽厄尔则探讨了计算机下棋,他们分别代表两派观点。讨论会的主持人是神经网络的鼻祖之一皮茨(Pitts),他最后总结时说:“(一派人)企图模拟神经系统,而纽厄尔则企图模拟心智(mind)……但殊途同归。”皮茨眼可真毒,这预示了人工智能随后几十年关于“结构与功能”两个阶级、两条路线的斗争。 开聊达特茅斯会议之前,先说六个最相关的人。首先,会议的召集者麦卡锡(John McCarthy)当时是达特茅斯学院的数学系助理教授。两年前(1954年)达特茅斯数学系同时有四位教授退休,这对达特茅斯这样的小学校真是不可承受之轻。刚上任的年轻系主任克门尼(Kemeny)之前两年才在普林斯顿逻辑学家丘奇(Church)门下得了逻辑学博士,于是跑到母校求援。这么说起来,克门尼算是图灵的师弟,他战时和物理学家费曼一起工作,还一度当过爱因斯坦的数学助理,后来一头扎在计算机里,和麦卡锡一起琢磨出了分时系统,但他最为人知的工作应该是老少咸宜的编程语言BASIC。现在估计已经没人知道BASIC语言发明人曾是LISP语言发明人的老板。克门尼是天生的官僚,后来位居达特茅斯的校长,美国三里岛核电站出事,总统委托他当调查委员会主席,这是后话。克门尼从母校数学系带回了刚毕业的四位博士前往任教,麦卡锡是其中之一。麦卡锡后来发明的LISP语言中最重要功能Eval实际就是丘奇的lambda演算,而且他后半生致力于用数理逻辑把常识形式化,大家由此猜他可能也是丘奇的学生,但其实不是,他压根学的就不是逻辑。他的老师是失去双手的代数拓扑学家所罗门·莱夫谢茨(Lefschetz)。但麦卡锡对逻辑和计算理论一直有强烈兴趣,他1948年刚到普林斯顿读研究生时就认识了冯·诺伊曼,在老冯影响下开始对在计算机上模拟智能发生兴趣。 会议的另一位有影响力的参加者是明斯基。他也是普林斯顿的数学博士,和麦卡锡在读书时就相熟。他的主业也不是逻辑,尽管他后来写过计算理论的书,还培养过好几个计算理论的博士,其中就有图灵奖获得者布鲁姆(Manual Blum)。布鲁姆目前和他老婆(就是实数计算模型BSS的B)、儿子一家三口都在卡内基梅隆大学任教。明斯基的理论情结和丘奇关系也不大,他的老师塔克(Tucker)是莱夫谢茨的学生,主要搞非线性规划和博弈论,多年担任普林斯顿数学系主任,是数学世家,儿子、孙子也都是数学家。所以按辈分论,麦卡锡还是明斯基的师叔。塔克的另一名出色的学生后来得了诺贝尔经济学奖,就是心灵美丽的纳什。纳什比明斯基小一岁,但比他早四年拿到博士,也算是明斯基的师兄。明斯基的博士论文做的是神经网络,他在MIT一百五十周年纪念会议上回忆说是冯·诺伊曼和麦卡洛克启发他做了神经网络。有人还找过他麻烦,质疑说神经网络的研究算数学吗,倒是老冯力挺说:现在不算,但很快就得算。倒是明斯基自己后来和神经网络结下梁子,那段故事见我的《“想啥来啥”和“吃啥补啥”的人工智能之争》(《东方早报·上海书评》2014年9月28日)。 塞弗里奇被后人提及不多,但他真是人工智能学科的先驱,他在MIT时一直和神经网络的开创人之一沃伦·麦卡洛克(Warren McCulloch)一起在维纳手下工作,他是维纳最喜欢的学生,但从没读完博士,维纳《控制论》一书的第一个读者就是塞弗里奇。塞弗里奇是模式识别的奠基人,他也写了第一个可工作的AI程序。他后来在麻省理工参与领导MAC项目,这个项目后一分为二:MIT计算机科学实验室和人工智能实验室,分久必合:现在这俩地方又合并了,变成MIT CSAIL。顺便给女读者添点料:塞弗里奇的爷爷就是英国第二大百货店塞尔福里奇(Selfridges)的创始人,塞尔福里奇百货和隔壁的哈罗德百货支撑着牛津街的零售业,现在大概一半顾客来自中国二线城市。 信息论的创始人克劳德·香农(Claude Shannon)被麦卡锡拉大旗做虎皮也请到会上打酱油。其实麦卡锡和香农的观点并不一致,平日相处也不睦。香农的硕士、博士论文都是讲怎么实现布尔代数,当时MIT校长布什(Bush)亲自指导。博士毕业后他去了普林斯顿高等研究院,曾和数学家外尔(Weyl)、爱因斯坦、哥德尔等共事,战争中,他一直在贝尔实验室做密码学的工作,图灵在1943年曾秘访美国,和同行交流破解德国密码的经验,其间和香农曾有会晤,一起聊过通用图灵机。战后香农去英国还回访过图灵,一起讨论过计算机下棋。香农内向,从没说过这段往事,直到1982年接受一次采访时才提起。1950年香农在《科学美国人》发表过一篇讲计算机下棋的文章。香农比其他几位年长十岁左右,当时已是贝尔实验室的大佬。 纽厄尔 另外两位重量级参与者是纽厄尔和司马贺(Herbert Simon)。纽厄尔是麦卡锡和明斯基的同龄人,他硕士也是在普林斯顿数学系,按说普林斯顿数学系很小,他们应有机会碰面,但那时纽厄尔和他俩还真不认识。他们的第一次见面,纽厄尔回忆是在IBM,而麦卡锡回忆是在兰德公司,纽厄尔硕士导师就是冯·诺伊曼的合作者、博弈论先驱摩根斯顿,纽厄尔硕士毕业就迁往西部加入著名智库兰德公司。在兰德开会时认识了塞弗里奇,并受到塞做的神经网络和模式识别的工作的启发,但方法论却完全走的是另一条路。 司马贺(Herbert Simon) 司马贺比他们仨都大十一岁(怀特海比罗素也大十一岁),那时是卡内基理工学院(卡内基梅隆大学的前身)工业管理系的年轻系主任,他在兰德公司学术休假时认识了纽厄尔。司马贺后来把纽厄尔力邀到卡内基梅隆大学,并给纽厄尔发了个博士学位,开始了他们终生的合作。 纽厄尔和司马贺的合作是平等的,司马是纽的老师,但他们合作的文章署名都是按字母顺序纽在前司马在后,每次他们受邀去演讲,都是轮流。司马每次见到别人把他名字放到纽厄尔之前时都纠正。他们共享了1975年的图灵奖,三年后司马贺再得诺贝尔经济学奖。纽厄尔和司马贺代表了人工智能的另一条路线:符号派,他们后来把他们的哲学思路命名为“物理符号系统假说”。简单地说就是:智能是对符号的操作,最原始的符号对应于物理客体。这个思路和英美的经验主义哲学传统接近。他们和当时的数学系主任、第一届图灵奖获得者阿兰·珀里思(Alan Perlis)一起创立了卡内基梅隆大学的计算机系,CMU从此成为计算机学科的重镇。 达特茅斯会议 会议原址:达特茅斯楼 1953年夏天,麦卡锡和明斯基都在贝尔实验室为香农打工。香农那时的兴趣是图灵机以及是否可用图灵机作为智能活动的理论基础,麦卡锡向香农建议编一本文集,请当时做智能研究的各位大佬贡献文章,这本文集直到1956年才以《自动机研究》(Automata Studies)为名出版,这个书名最后是香农起的,他不想花里胡哨,但麦卡锡认为这没有反映他们的初衷。 文集的作者有两类人,一类是逻辑学家(后来都变成计算理论家了),如丘奇的两位杰出学生马丁·戴维斯和克里尼,后者的名著《元数学导论》国内有逻辑学家莫绍揆先生的译本。明斯基、麦卡锡也都有论文录入,香农本人贡献了一篇讲只有两个内部状态的通用图灵机的文章,文集录入的一篇冯·诺伊曼的论文后来开创了容错计算。文集的另一类作者几乎都是维纳的信徒,如阿什比(Ross Ashby)等,以控制论为基础。麦卡锡素不喜控制论和维纳,既不想把维纳当老大,也不愿和他见面争执,其中原因不详,或许和维纳与麦卡洛克吵翻了有关。麦卡洛克和皮茨两位为维纳《控制论》思想贡献多多的人物,在维纳的自传里压根没被提及。麦卡锡同时又觉得香农太理论,当时他想自立门户,只对用计算机实现智能感兴趣。于是他筹划再搞一次活动。 1955年夏天,麦卡锡到IBM打工(美国教授都是九个月工资,如果没有研究经费,夏天要自己觅食),他的老板是罗切斯特(Nathaniel Rochester),罗切斯特是IBM第一代通用机701的主设计师并对神经网络素有兴趣。他们两人倒是挺对脾气,决定第二年夏天在达特茅斯搞一次活动,他俩遂说动了香农和当时在哈佛做初级研究员(Junior Fellow)的明斯基(哈佛的Fellow还是挺值钱的,历史上人数不多,蒯因、王浩、库恩在变成正式教授之前都做过。乔姆斯基几乎在同时也是哈佛的Fellow)一起给洛克菲勒基金会写了个项目建议书,希望得到资助。美国富豪还是有文化传统,至少知道要资助好东西,值得中国土豪的后代学习,别像他们的父辈即使打着“办大学”的名义还是要骗钱。 麦卡锡给这个第二年的活动起了个当时看来别出心裁的名字:“人工智能夏季研讨会”(Summer Research Project on Artificial Intelligence)。普遍的误解是“人工智能”这个词是麦卡锡想出来的,其实不是。麦老晚年回忆也承认这个词最早是从别人那里听来的,但记不清是谁。后来英国数学家菲利普·伍德华(Woodward)给《新科学家》杂志写信说他是AI一词的始作俑者,麦卡锡最早是听他说的,因为他1956年曾去MIT交流,见过麦卡锡。但麦卡锡的建议书1955年就开始用“人工智能”了,人老了回忆真不靠谱。当事人除了明斯基之外,都已仙逝,这事恐怕要成悬案了。 大家对“人工智能”这个词一开始并没取得完全共识。很多人认为啥事一加“人工”就变味了。纽厄尔和司马贺一直主张用“复杂信息处理”这个词,以至他们发明的语言就叫IPL(Information Processing Language)。他们从某种意义上说偏功能学派,也就是说找到智能的功能不一定非得依靠结构相同或相似。图灵机和递归函数等价,但结构完全不同,所以他们强调“信息处理”。他们俩一开始颇不喜“人工智能”几个字。1958年,在英国国家物理试验室(NPL)召开了“思维过程机器化”(Mechanization of Thought Process)会议,达特茅斯会议的麦卡锡、明斯基、塞弗里奇都参加了,此外还有致力神经网络研究的麦卡洛克,以及英国的控制论代表人物阿什比。两位编程语言的先驱也出席了:巴克斯(Backus)发表了一篇关于他新发明的语言FORTRAN的论文,但他后来一直是函数式语言的倡导者;美国海军女少将格蕾丝·哈泊(Grace Hopper)的文章是讲第一个编译器的,这项工作导致了COBOL语言,中国也有女少将,也是码农。他俩论文的题目里都有Automatic Programming的说法,这在当时就是指高级语言编程,不能和后来人工智能中的自动编程搞混了。这次会上有人再提“人工思维”(Artificial Thinking)的说法。司马贺等人由此也逐渐接受了AI的说法,他晚年还写了本书“人工的科学”,倒是把Artificial这个词更加放大了。 AI历史的方法论 历史研究素有两种方法,基于事件的,基于课题(issue)的。人和事的八卦都属前种。纽厄尔在1981年为一本颇为有料的文集《信息研究》贡献的一篇文章“AI历史的智力课题”走了第二条路线。他的方法也挺有意思。他把AI历史当作斗争史,把历史分为两个阶级、两条路线的斗争,于是历史成了一串儿对立的议题,如模拟vs数字,串行vs并行,取代vs增强,语法vs语义,机械论vs目的论,生物学vs活力论,工程vs科学,符号vs连续,逻辑vs心理等,在每一议题下有进一步可分的子议题,如在逻辑vs心理下又有定理证明vs问题求解等。
READ MORE