初探人工智能
夏洁云
(广州市工程技术职业学院)
摘要:通过机器实现模仿人类的行为,已经有很长的历史了。人工智能研究作为一门科学的前沿和交叉学科,它的发展历史和计算机科学与技术的发展史联系在一起。本文介绍了人工智能的定义和发展历程,并对人工智能的未来作了大胆的预测。
关键词:人工智能 进化 自动定理证明 搜索 知识工程
1 人工智能简介
人工智能已对现实社会做出了非常重大的贡献,而且其作用已在各领域发挥得淋漓尽致,特别是在计算机领域,人工智能的应用更加突出,可以说,哪里有计算机应用,哪里就在应用人工智能;哪里需要自动化或半自动化,哪里就在应用人工智能的理论、方法和技术。 目前,人工智能应用的主要领域,也就是计算机应用的主要领域。
人工智能是一门研究人类智能的机理以及如何用机器模拟人的智能的学科。从后一种意义上讲,人工智能又被称为“机器智能”或“智能模拟”。人工智能是在现代电子计算机出现之后才发展起来的,它一方面成为人类智能的延长,另一方面又为探讨人类智能机理提供了新的理论和研究方法。
人工智能研究的一个主要目的是使机器能够胜任一些通常需要人类智能才能完成的复杂工作。但是,不同的时代、不同的人对这种“复杂工作”的理解是不同的。例如繁重的科学和工程计算本来是要人脑来承担的,现在电子计算机不但能完成这种计算,而且能够比人脑做得更快、更准确,于是当代人已不再把这种计算看作是“需要人类智能才能完成的复杂任务”。可见复杂工作的定义是随着时代的发展和技术的进步而变化的,人工智能这门科学的具体目标也自然随着时代的变化而发展。它一方面不断获得新的进展,一方面又转向更有意义、更加困难的目标。
人工智能的发展历史是和计算机科学与技术的发展史联系在一起的。除了计算机科学以外,人工智能还涉及信息论、控制论、自动化、仿生学、生物学、心理学、数理逻辑、语言学、医学和哲学等多门学科。
从国际范围来看,人工智能的研究途径主要有三条。第一,生理学途径,采用仿生学的方法,模拟动物和人的感官以及大脑的结构和机能,制成神经元模型和脑模型;第二,心理学途径,应用实验心理学方法,总结人们思维活动的规律,用电子计算机进行心理模拟;第三,工程技术途径,研究怎样用电子计算机从功能上模拟人的智能行为。目前,第三种研究方法发展较快。它也从前两种方法中吸收新的思想,依靠新的启示扩大自己的成果。
2 人工智能的过去
一般认为,人工智能的思想萌芽可以追溯到德国著名数学家和哲学家莱布尼茨(Leibnitz,1646-1716)提出的"通用语言"设想。这一设想的要点是:建立一种通用的符号语言,用这个语言中的符号表达“思想内容”,用符号之间的形式关系表达“思想内容”之间的逻辑关系。于是,在“通用语言”中可以实现“思维的机械化”这一设想可以看成是对人工智能的最早描述。
计算机科学的创始人图灵被认为是“人工智能之父”,他着重研究了一台计算机应满足怎样的条件才能称为是“有智能的”。1950年他提出了著名的“图灵实验”:让一个人和一台计算机分别处于两个房间里,与外界的联系仅仅通过键盘和打印机。由人类裁判员向房间里的人和计算机提问(比如:“你是机器还是人?”或“你是男人还是女人?”等等),并通过人和计算机的回答来判断哪个房间里是人、哪个房间里是计算机。图灵认为,如果“中等程度”的裁判员不能正确地区分,则这样的计算机可以称为是有智能的。“图灵实验”是关于智能标准的一个明确定义。有趣的是,尽管后来有些计算机已经通过了图灵实验,但人们并不承认这些计算机是有智能的。这反映出人们对智能标准的认识更深入、对人工智能的要求更高了。
几乎在图灵上述工作的同时,冯·诺依曼从生物学角度研究了人工智能。从生物学的观点看,智能是进化的结果,而进化的基本条件之一是“繁殖”。为此, 冯·诺依曼构造了“自再生自动机”,这是一种有“繁殖”能力的数学模型。 冯·诺依曼的分析表明, 自再生自动机的内容结构对于“繁殖”是充分的和必要的。他进而推测,这种结构必定存在于活的细胞之中。五年之后,克里克和沃森关于DNA结构的重大发现完全证实了冯·诺依曼的猜测: 自再生自动机的几个功能模块均有生物学上的对应物。其中,模块A对应于核糖体,B对应于RND酶和DNA聚合酶,D对应于RNA和DNA,E对应于阻遏控制分子和抗阻遏控制分子等。 冯·诺依曼的工作为后来人工智能中的一条研究路线(人工生命)提供了重要的基础。
图灵和冯·诺依曼的上述工作,以及麦克考洛和匹茨对神经元网的数学模型的研究,构成了人工智能的初创阶段。
1956年夏天举行的达德茅斯研讨会,被认为是人工智能作为一门独立学科正式诞生的标志。这次研讨会聚集了来自数学、信息科学、心理学、神经生理学和计算机科学等不同领域的领导者,包括Minsky,Rochester, Simon, Solonio和Mccarthy等。其中,Miusky,Mccarthy,Newell和Simon后来被认为是美国人工智能界的“四大领袖”。与会者从不同角度搜索了使机器具有智能的途径和方式,并决定用“人工智能”(Artificial Intelligence)一词来概括这一新的研究方向。达德茅斯研讨会开创了人工智能的第一个发展时期。在这个时期里,研究者们展开了一系列开创性工作,并取得了引人注目的成果。
会后不久,Newell,Shaw和Simon完成了一个自动证明数学定理的计算机程序Logic Theorist (此前Martin和Davis曾编制了一个算术定理的证明程序,但未发表),证明了《数学原理》第二章中的38条定理,由此开创了人工智能中“自动定理证明”这一分支。
1958年,美籍逻辑学家王浩在自动定理证明中取得的重要进展。他的程序在IBM704计算机上用不到5分钟的时间证明了《数学原理》中“命题演算”的全部220条定理。1959年,王浩的改进程序用8.4分钟证明了上述220条定理及谓词演算的绝大部分定理。
1983年,美国数学学会将自动定理证明的第一个“里程碑奖”授予王浩,以表彰他的杰出贡献(自动定理证明的“里程碑奖”每25年评选一次,由此可见其份量)。受王浩工作的鼓舞,自动定理证明的研究形成一股热潮。比如,Slagle的符号积分程序SAINT经测试已达到了大学生的积分演算水准;而Mosis的SIN程序的效率比SAINT提高了约三倍,被认为达到了专家水平。
自动定理证明的理论价值和应用范围并不局限于数学领域。事实上,很多问题可以转化为定理证明问题,或者与定理证明有关。可以认为,自动定理证明的核心问题是自动推理,而推理在人的智能行为中起普遍性的重要作用。基于这一看法,在自动定理证明的基础上进一步研究通用问题求解,是一个值得探索的课题。从1957年开始,Newell,Shaw和Simon等人着手研究不依赖于具体领域的通用解题程序,称之为GPS,它是在Logic Theorist的基础上发展起来的,虽然后来的实践表明,GPS作为一个独立的求解程序,其能力是有限的,但在GPS中发展起来的技术对人工智能的发展有重要意义.
人工智能早期研究给人的深刻印象是博羿,1956年,Samnel研制了一个西洋跳棋程序,该程序“天生”下跳棋水平很低,远远不是Samuel的对手。但它有学习能力,能从棋谱中学习,也能在实践中总结提高。经过三年的“学习”,该程序与1959年打败了Samuel;又经过三年,打败了美国一个州的冠军。值得注意的是,虽然下棋至多只能算是一项体育运动,下棋的程序似乎只是一种游戏程序,但Samuel工作的意义十分重大:它同时刺激了“搜索”和“机器学习”这两个人工智能重要领域的发展。
与自动定理证明的研究意义不限于数学一样,搜索的研究意义也不限于博弈。根据认知心理学的信息处理学派的观点,人类思维过程的很大一部分可以抽象为从问题的初始状态经中间状态到达终止状态的过程,因此可以转化为一个搜索问题,由机器自动地完成。例如“规划”问题。设想一台机器人被要求完成一项复杂任务,该任务包含很多不同的子任务,其中某些子任务只有在另一些子任务完成之后才能进行。这时,机器人需要事先“设想”一个可行的行动方案,使得依照该方案采取行动可以顺利完成任务。“规划”即找出一个可行的行动方案,可以通过以其子任务为状态、以其子任务间依赖关系为直接后继关系的状态空间中的搜索来实现。
人工智能的早期研究还包括自然语言理解、计算机视觉和机器人等等。通过大量研究发现,仅仅依靠自动推理的搜索等通用问题求解手段是远远不够的。Newell和Simon等人的认知心理学研究表明,各个领域的专家之所以在其专业领域内表现出非凡的能力,主要是因为专家拥有丰富的专门知识(领域知识和经验)。70年代中期,Feigenbaum提出知识工程概念,标志着人工智能进入第二个发展时期。知识工程强调知识在问题求解中的作用;相应地,研究内容也划分为三个方面:知识获取,知识表示和知识利用。知识获取研究怎样有效地获得专家知识;知识表示研究怎样将专家知识表示成在计算机内易于存储、易于使用的形式;知识利用研究怎样利用已得到恰当表示的专家知识去解决具体领域内的问题。知识工程的主要技术手段是在早期成果的基础上发展起来的,特别是知识利用,主要依靠自动推理和搜索的技术成果。在知识表示方面,除使用早期工作中出现的逻辑表示法和过程表示法之外,还发展了在联想记忆和自然语言理解研究中提出的语义网表示法,进而引入了框架表示法,概念依赖和脚本表示法以及产生式表示法等等各种不同方法。与早期研究不同,知识工程强调实际应用。主要的应用成果是各种专家系统。专家系统的核心部件包括:
(a)表达包括专家知识和其他知识的知识库。
(b)利用知识解决问题的推理机。
大型专家系统的开发周期往往长达10余年,其主要原因在于知识获取。领域专家虽然能够很好地解决问题,却往往说不清自己是怎么解决的,使用了哪些知识。这使得负责收集专家知识的知识工程师很难有效地完成知识获取任务。这种状况极大的激发了自动知识获取----机器学习研究的深入发展。已经得到较多研究的机器学习方法包括:归纳学习、类比学习、解释学习、强化学习和进化学习等等。机器学习的研究目标是:让机器从自己或“别人”的问题求解经验中获取相关的知识和技能,从而提高解决问题的能力。
3 人工智能的现在
80年代以来,随着计算机网络的普及,特别是Internet的出现,各种计算机技术包括人工智能技术的广泛应用推动着人机关系的重大变化。据日美等国未来学家的预测,人机关系正在迅速地从“以人为纽带”的传统模式向“以机为纽带”的新模式转变人机关系的这一转变将引起社会生产方式和生活方式的巨大变化,同时也向人工智能乃至整个信息技术提出了新的课题。这促使人工智能进入第三个发展时期。
在这个新的发展时期中,人工智能面临一系列新的应用需求。
首先是需要提供强有力的技术手段,以支持分布式协同工作方式,现代生产是一种社会化大生产,来自不同专业的工作者在不同或相同的时间、地点从事着同一任务的不同子任务。这要求计算机不仅为每一项子任务提供辅助和支持,更需要为子任务之间的协调提供辅助和支持。由于各个子任务在很大程度上可以独立地进行,子任务之间的关系必然呈现出动态变化和难以预测的特点。于是,子任务之间的协调(即对分布协同工作的支持)向人工智能乃至整个信息技术以及基础理论提出了巨大的挑战。
其次,网络化推进了信息化,使原本分散孤立的数据库形成一个互连的整体,即一个共同的信息空间。尽管现有的浏览器和搜索引擎为用户在网上查找信息提供了必要的帮助,这种帮助是远远不够的,以至于“信息过载”与“信息迷失”状况日益严重。更强大的智能型信息服务工具已成为广大用户的迫切需要。另一方面,信息空间对人类的价值不仅在于单独的信息条目(比如某厂家生产出了某一新产品的信息),还远在于一大类信息中隐藏着的普遍性知识(比如某个行业供求关系的变化趋势)。于是,数据中的知识发现也成为一项迫切的研究课题。机器人始终是现代工业的迫切需求。随着机器人技术的发展,研究重点已经转向能在动态、不可预测环境中独立工作的自主机器人,以及能与其他机器人(包括人)协作的机器人。显然,这种机器人之间的合作可以看成是物理世界中的分布式协同工作,因而包括相同的理论和技术问题。
由此可见,人工智能第三发展时期的突出特点是研究能够在动态、不可预测环境中自主、协调工作的计算机系统,这种系统被称为Agent 。目前,正围绕着Agent的理论、Agent的体系结构和Agent语言三个方面展开研究,并已产生一系列重要的新思想、新理论、新方法和新技术。在这一研究中,人工智能呈现一种与软件工程、分布式计算以及通讯技术相互融合的趋势。Agent研究的应用不限于生产和工作,还深入到人们的学习和娱乐等各个方面。例如,Agent与虚拟现实相结合而产生的虚拟训练系统,可以使学生在不实际操纵飞机的情况下学飞行的基本技能;类似地,也可使顾客“享受”实战的“滋味”。
综观人工智能的发展历程,可以看出它始终遵循的基本思路。首先是强调人类智能的人工实现而不是单纯的模拟,以便尽可能地为人类的实际需要服务。其次是强调多学科的交叉结合,数学、信息科学、生物学、心理学、生理学、生态学以及非线性科学等等越来越多的新生学科被融入到人工智能的研究之中。
目前人工智能研究的3个热点是: 智能接口、数据挖掘、主体及多主体系统。
智能接口技术是研究如何使人们能够方便自然地与计算机交流。为了实现这一目标,要求计算机能够看懂文字、听懂语言、说话表达,甚至能够进行不同语言之间的翻译,而这些功能的实现又依赖于知识表示方法的研究。因此,智能接口技术的研究既有巨大的应用价值,又有基础的理论意义。目前,智能接口技术已经取得了显著成果,文字识别、语音识别、语音合成、图像识别、机器翻译以及自然语言理解等技术已经开始实用化。
数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。数据挖掘和知识发现的研究目前已经形成了三根强大的技术支柱: 数据库、人工智能和数理统计。主要研究内容包括基础理论、发现算法、数据仓库、可视化技术、定性定量互换模型、知识表示方法、发现知识的维护和再利用、半结构化和非结构化数据中的知识发现以及网上数据挖掘等。
主体是具有信念、愿望、意图、能力、选择和承诺等心智状态的实体,比对象的粒度更大,智能性更高,而且具有一定自主性。主体试图自治地、独立地完成任务,而且可以和环境交互,与其他主体通信,通过规划达到目标。多主体系统主要研究在逻辑上或物理上分离的多个主体之间进行协调智能行为,最终实现问题求解。目前对主体和多主体系统的研究主要集中在主体和多主体理论、主体的体系结构和组织、主体语言、主体之间的协作和协调、通信和交互技术、多主体学习以及多主体系统应用等方面。
4 人工智能的未来
人工智能可能会向以下几个方面发展: 模糊处理、并行化、神经网络和机器情感。目前,人工智能的推理功能已获突破,学习及联想功能正在研究之中,下一步就是模仿人类右脑的模糊处理功能和整个大脑的并行化处理功能。人工神经网络是未来人工智能应用的新领域,未来智能计算机的构成,可能就是作为主机的冯·诺依曼机与作为智能外围的人工神经网络的结合。研究表明:情感是智能的一部分,而不是与智能相分离的,因此人工智能领域的下一个突破可能在于赋予计算机情感能力。情感能力对于计算机与人的自然交往至关重要。
人工智能一直处于计算机技术的前沿,人工智能研究的理论和发现在很大程度上将决定计算机技术的发展方向。
由于计算机芯片的微型化已接近极限。人们越来越寄希望于全新的计算机技术能够带动人工智能的发展。目前至少有三种技术有可能引发全新的革命,它们是光子计算机、量子计算机和生物计算机。
根据推测,未来光子计算机的运算速度可能比今天的超级计算机快1000到1万倍。而一台具有5000个左右量子位的量子计算机可以在大约30秒内解决传统超级计算机需要100亿年才能解决的素数问题。相对而言,生物计算机研究更加现实,美国威斯康星-麦迪逊大学已研制出一台可进行较复杂运算的DNA计算机。据悉,一克DNA所能存储的信息量可与1万亿张CD光盘相当。如果未来上述三种技术能够成熟运用,那将对人工智能的发展起到决定性的作用。
5 结束语
许多科学家断言,机器的智慧会迅速超过阿尔伯特·爱因斯坦和斯蒂芬·霍金的智慧之和。著名物理学家斯蒂芬·霍金认为,就像人类可以凭借其高超的捣弄数字的能力来设计计算机一样,智能机器将创造出性能更好的计算机。最迟到本世纪中叶而且很可能还要快得多,计算机的智能也许就会超出人类的智能。
参考文献
[1]《人工智能简史》孙兴 清华大学出版社, 1990年
[2]蔡自兴 徐光佑 《人工智能及其应用》 清华大学出版社 2002年1月