一般我们评价身边的“聪明人”会用什么词?反应快,解决问题能力强,能发现别人发现不了的东西……这些日常褒奖的词我们可以称之为——“抽象能力强”。西蒙就是一个抽象能力高手,今天我们就借由他在人工智能领域的探索来感受下西蒙的高阶思维。
1956年,达特茅斯大会上,西蒙和他的合作伙伴合作了一台机器——逻辑理论家Logic Theorist。他们用这个程序证明了《数学原理》第二章里面的38个定理。这是非常重要的一个节点。在西蒙之前,大家普遍只是认为电子计算机是增强人算力的工具。而西蒙发现计算机虽说在算数,可它的底层是符号处理,能不能用它来模拟人的思维,进行问题求解呢?
在西蒙看来,符号就是模式,任何一个模式,只要他能与其他模式相区别,它就是一个符号。所以人的神经、语言文字、计算机的处理语言都可以看作是一种符号,它既可以是物理的,也可以是头脑中抽象的。而物理符号系统的基本任务和功能就是辨认相同的符号和区分不同的符号。
你读报纸时对信息的加工,听得到音频对信号的处理,都是一种符号处理操作;你工作时回复各类消息、写邮件,计算机也在做符号处理操作。西蒙认为物理符号系统要满足六点:
1. 输人( input):把字母打进计算机、眼睛看黑板上的字,都可以认为是一种符号输入
2. 输出( output):计算机从荧光屏上显示出结果、人在纸上写字,都是符号输出。
3. 存储(stoe):计算机中存储信息、人记住某件事,都是存储符号。
4. 复制(copy):计算机复制出一段文字材料、人认出某个字并复制成内部心理表征,都是复制符号。
5. 建立符号结构( build symbol structure):计算机通过找到各种符号之间的关系,形成符号结构;老师为了讲课,汇集各种材料建立它们之间的联系,使之构成一个完整的系统。这些都是建立符号结构。
6. 条件性迁移( conditional transfer):计算机依赖已有的符号继续完成某种行为;人利用记忆中已有的符号结构,再加上外界的输入,就可以继续完成一个活动过程。这都可以看成是条件性迁移。
不过这些只是假说,只要能做符号加工就代表存在智能,还需要很多验证。西蒙又切换到认知心理学去研究:人到底是如何认知的。
在西蒙当时的研究条件,心理学家对神经元、神经突触还不十分了解,西蒙发现科学理论的研究可以分不同层次与水平,就像物理学,对一个杯子,力学可以直接研究它与其他物体的相互关系,不必等到搞清楚整个原子结构,再去研究力学。心理学也是如此。他说心理学有三种不同层次与水平。第一层主要研究问题解决这类复杂行为;第二层研究的是反应时等简单信息加工过程;第三层就是对神经结构这些生理水平的研究。西蒙主要在第一层展开了探讨。
人脑的注意力是有限的,想一件事、做一件事,做有限的计算。比如我们在切菜的时候最好关注切菜,如果你出神想别的,手指可能就比较危险了。人通过提出策略启发式地解决眼前问题,在解决问题时追求满意解而非最优解。比如你饿着肚子在街上找餐馆,大概率是就近看看有什么好吃的,马上进去吃,而非掏出手机把满城的餐馆都比较全了,挑一家最好吃的进去。人还有一个特点是根据不同的状况来调整自己满足的幅度。比如,今天雾霾没能出去跑步,你改去看电影了,好像也很开心。这三点是人类大脑认知的三种机能。
人类工作记忆是有容量的,大概是 7 加减 2。比如我单个报出 20 个数字,一般人大概能记住 7 个左右。而如果你自己将这些数字分成 5 组,大概可以全部记住。西蒙在实验研究中得出的结果是:一个人1分钟到1分半钟可以记忆一个信息,心理学把这样一个信息称为“块”。西蒙基于此提出组块理论。组块策略就是将零散的构件组成有意义的单元。从信息加工的角度来看,组块是人对信息进行组织或再编码。
基于这些研究,他开始做人工智能研究,借由各类数学游戏,模拟人类解决问题的方法,像启发式搜索、目的手段分析、约束满足方法,以及产生式语言等等。西蒙还发现专家与新手相比,解决问题的效率明显高很多,这是因为专家已经有了大量的知识积淀,头脑中存储了大量的模型和路径,而新手解决问题可能用的方法更笨,自然在效率上就比不上专家。
讲了半天枯燥的概念,你可能会好奇这些研究和我们学习者有什么关系呢?1983年,中科院心理研究所曾邀请西蒙来中国讲演了 3 个月,结集成《人类的认知》这本小册子,基本涵盖了西蒙 40 年来对认知心理学研究成果。其中里面他提到,我们在研究人工智能问题时,用下围棋等有什么意义?
西蒙说我们不要关心问题的解决结果,而且要关心解决问题的方法。新手和专家或许都能解决问题,可他们用的方法可能截然不同。所以我们在学习某门课程或新知识,应该学会的是背后的解决策略,这样随时可以把方法迁移到新的情境中去。
比如心理学教程里常举的四条直线通过 9 个点的问题。看起来容易,解决起来很难。要解决这个问题,解题者所画直线一定要超出这9个点形成的正方形。尽管出题人没有限制,可解题者容易忽略这种可能性,将思维限制在虚有的正方形中。
再比如经典的过河问题:三个书生,三个野人过河,小船每次最多坐两个人,而且要保证每个岸上的书生数量不得少于野人。你怎么办?你可能在纸上写写画画半天没得出答案。这题的关键步骤是想到有一步,一定是一个书生和一个野人同时划船回来,只有想到这里,以后各步才容易。可能大学教授没想换到这步,也做不出来。
又如经典的汉诺塔问题:有三根杆子A,B,C。A杆上有N个(N>1)穿孔圆盘,盘的尺寸由下到上依次变小。要求按下列规则将所有圆盘移至C杆:
可将圆盘临时置于B杆,也可将从A杆移出的圆盘重新移回A杆,但都必须遵循上述两条规则。如何移?最少要移动多少次?
你能想到多少种方法?西蒙列举出四种解决方案:目标递归策略,知觉策略,模式策略,机械记忆策略。这几类策略都可以解决这个问题,不过每种方式的解决效率大不相同。前三种利用符号表征,将解决方案转化为可自动操作的程序,而第四种则是针对具体问题的具体解决,换了情景就不能迁移,你会选择哪种?
其实符号思考,本质上是在掌握不同的大脑运行程序,为我们学习、解决问题提供快速调用的接口,在遇到同类型的问题时,触类旁通。西蒙在思考问题时,就常用各类符号进行表征,它们可能没有精确的意义,却足以启发思考:
数学对我经常是思维的语言,我不知道精确的含义,但我能设法解释它。在解决一个问题时,我肯定不经常用词语思考,而是用较抽象的表征,它也许部分是图画或图表,而部分是符号。数学——这种非词语的思维——是我发现的语言。它是我用以产生新观念的工具。这种数学是相对不精确、不严谨,但有启发性的。必须核查用它得到的“解”的正确性。这是物理学家的数学或工程师的数学,而不是数学家的数学。
西蒙的物理符号系统假说打破了原来行为主义学派的认识。行为主义学派只关心输入跟输出两端,而西蒙用计算机程序来模拟,因而可以解释思维两端内在的过程,不仅仅是输入输出,而是输入到输出中间这个内在的过程可以用计算机程序来模拟,所以这点对心理学研究是有非常革命性的影响。
西蒙也在其 1975 年两度再版的《管理决策新科学》中继续阐述了计算机对生产与管理决策的影响,用计算机进一步拟合人类决策的特征。他深入组织内部管理决策过程,将决策区分为类似副经理所代表的面向企业内部信息d额程序性决策和正经理所代表的面向市场形势分析的非程序性决策两部分。借由最新的计算机科学发展,程序性决策计算机有望解决,使工作近乎自动化。而非程序性决策还十分复杂,实现还比较难。但是在西蒙看来,由于大脑思维也不外乎是符号系统的处理,管理决策也就是问题求解,用启发式探索解决问题。那人的非程序性决策,也一定也有规律可循。随着时间的推移,非程序性的复杂结构的决策,也会一部分与部分程序化,使用计算机替代也是有希望的。这种预测,也在逐步得到证实。