火,进化与人工智能 Apex (一) 昨天举了一个火的例子,被众人称善。虚荣心谁没个三两五两阿,况且这买卖还 有利可图---不就是打个比方嘛:) 先说这火吧。诸位手头如果恰好有火柴,不妨划上一根,记我帐上。看到没?一 团小火苗,凹凸有致的轮廓,左扭右摆的。。。学物理的,建个方程描述一下该 不难吧。敢把手指头放上去试试?没错,你感觉到了温暖。再把火柴凑到眼前看 看?恭喜您,您又见到了光明。。总之,火有着明显的外观和特点,你不会把它 同火柴棍混为一谈。 别介意,这么说没有愚弄大伙的意思。我是想先活动一下手指头,顺便整理一下 思路。好了,整理完毕,开吹。 先说这AI研究里的TOP DOWN方式吧。有人给翻译成“头朝下”,反正就是类似的 意思吧。如果我们是中世纪的炼金术士(注意,要打比方了)。我们想研究火, 可是我们的眼睛由于水银中毒,已经弱视到了看不清火苗。该怎么办捏?对, “黑箱法”!找一个大铁箱子罩在火上,然后再用温度计做测量。我们会惊讶地 发现,温度的分布有某种规律:某个区域特别热,周围温度渐渐变凉。再仔细 点,我们会发现这个中心的高温区也在慢慢变动(大脑是不是也有这样的活跃 区?)。够了,先发几篇N/S文章混口饭吃吧[参见,方舟女,123,456]。 随后,意见终于发生了分歧。我说咱应该用很多的电阻丝来研究火。你看,如果 拿很多的电阻丝堆在一起,再通上不同的电流,错落有致,那不就和黑箱子里的 火一模一样嘛?!你说那哪行阿,一定要走BOTTOM UP路线,两眼一抹黑你研究 个头啊。对了,BOTTOM UP这词上次惨遭侮辱,我就不揭发了。总之,你一怒之 下踢翻黑箱子,把木柴棍一根根地划拉出来,在地上摆弄起来。按你的说法,火 是由木柴构成的,这么弄是不可能没有道理的。 先让我来附和一下你的做法。一堆木柴,如何才能堆产生火呢?生活经验告诉我 们,如果一堆木柴堆放的非常紧密,在某种条件下,会发生所谓的“自燃”!这 真是最自然而然的道理了,天才!如果我们没有看见火(AI),那一定是由于我 们堆的木柴(神经网络)不够多,堆的方式不够复杂。那就赶紧行动吧。。。 切慢,又有人出来发话了(我发誓不是我,是彭罗斯;又,世界上总是有这样的 人!):这么做太愚蠢。难道你没见过老天爷的发怒吗?一道闪电从天而降,不 是常常造成火灾的嘛。想想也是,火(AI)完全可以依靠神秘的闪电(量子效 应)点燃的。。。 说来说去,现在连我自己也厌了。公布答案,至少是我认为的答案。其实,那些 研究电阻丝的,摆弄木柴棍的,都是些盲人摸象的“弱智”(抱歉了,FXX)。 木柴生成火的原因就是氧化-还原反应。而这个反应就是火能够生成的所谓“元 规则”。如果再深入,我们还会了解到电子对的这个那个知识。一旦我们了解了 这个反应,我们就完全可以不必拘泥在木柴棍上了~~~~很多的金属不是也可以 “燃烧”吗? (二) 记得有句话说的挺逗:what is a matter? no matter;what is a mind? never mind。 这段时间恰好比较闲,继续扯几句这方面的话题。希望能抛砖引玉,反 正是外行评论内行,不对还请专家能never mind。 在以前的讨论中提到过形式逻辑系统,以及哥德尔、图林等人的工作。说的不很 详细,这里先做个补充。数学家或者逻辑学家认为存在着两个世界:由形式系统 构成的符号世界和数学事实构成的现实世界。形式系统包含抽象的符号集合,支 持符号集合并使之意义正确的语法(推理规则)和一个公理集合(不能从其它符 号语法推导出的字符串);数学事实就是各种数学陈述(命题),比如1+1=2, 三角形内角和等于180度等。对于前者,如果从一个公理集合出发,通过一系列 正确的推理规则,能够得出一个陈述。那么得到陈述的这个过程序列就被称做是 定理。现在的问题是,是否存在把每一个真命题都翻译成定理,反之,把每一个 定理都翻译成真命题的形式系统。如果有,这两个世界的对应程度如何? 众所周知,这个希尔伯特提出的问题被哥德尔天才性地解决了。哥德尔定理是 说,对于一致的、声称要判定所有算数陈述,即证明或者证伪它们的形式系统 F,都存在一个算数命题,在该系统中既不能证明也不能证伪。因此,形式系统F 是不完备的。图林的贡献之一是提出了UTM(Universal Turing Machine)概念, 并且证明了一个形式逻辑系统和UTM是等价的。也就是说,当给定一个无限记忆 的数字计算机(UTM)C时,我们可以找到一个形式系统F,使C的可能输出和F的 可能定理一致,反之也成立。 目前看来,构成对强AI原理最有力的挑战正是来自这个“哥德尔定理”。牛津的 JOHN LUCAS提出:由于存在我们人类能够看出为真,但机器不能证明它为真的算 数真理,因此人类心智必定超越任何机器的能力。后来,同一大学的彭罗斯在他 的“皇帝新脑”中也运用这个定理得出同样的结论:机器不可能象人一样思考。 他的假定之一是:人类的部分思考与不可计算量有关。不可计算量是个有严格定 义的数学概念,大家可以自己去看是什么,我就不多说了。总之,他认为对意识 起源最好的解释是,存在神秘的量子事件影响大脑神经元的工作方式。 在前面的贴子里,我提到AL在进化规则影响下产生AI是最自然的研究方式。有网 友提出不同意见,认为神经网络才是研究AI的正确方式。对这个问题属于争鸣 吧。我现在就谈谈为何神经网络产生AI是不充分的。神经网络的拥护者实际上是 采取一种BOTTOM UP的研究策略。他们的中心思想是:把网络中的每一个处理元 与大脑中的物理神经元对应起来,对于处理元的每一个联结给予不同的权重(模 拟大脑神经元的兴奋和抑制)。一个处理元的行为由它附近的处理元发出的信号 组合来决定。这套系统的目的就是通过所谓的“训练”来调整最初给予的权重, 以便的回应一套固定模式。一旦所谓的训练结束,网络就能“智能地”回应类似 的模式。这种联结主义的构想方式当然是可以解决一些具体问题的,比如神经网 络在模式识别中的应用等等。然而,BOTTOM UP策略最大的难题是如何对付所谓 的“常识知识”(TACIT KNOWELDGE)问题。例如,对于一个神经网络,什么样 的输入是“恰当的”输入呢?如何概括“好”输出?网络如何在输入输出中分辨 “类”的概念?而且,这种输入->(形式逻辑的)转换->输出模式必然要遇到哥 德尔定理的拮难。。。 我在前面的贴子中提到(当然,我不可能是第一个提出者,算是这种观点的拥护 者吧),AL通过进化规则产生AI是最自然的方式。作为物理实体的有智能的我 们,本身不正是进化的产物吗?很多的关于AL的研究都表明,进化规则可以是独 立于特殊物质基础的。这个问题我将在以后继续谈论。 (三) 上回谈到,哥德尔发现,不是所有的“真”命题都能用形式化的“证明”来代 替,也就是说,总存在某个陈述你既不能用某个形式系统来证明,也不能来证 伪。其实,对于AI的议论本该就此打住了。再往前走可以说步步是雷区,一不小 心就成伪科学了。不过,我不下地狱谁下地狱,对吧? 前几天见这里的一些网友在谈随机数,当时第一个反应就是想起了蔡汀 (Gregory Chaitin)。不过由于记忆年代久远,怕出丑没敢插嘴。回去查了一 下,现在转回头说上几句。第一次听蔡汀的名字,是上一门叫做FORMAL METHOD 的计算机课。讲课的是一个半拉老头,有着蒋门神的体魄和气度。这厮绝对是少 数那种让人看一眼就觉得深不可测的类型。花白烙腮胡子,霸道的德国英语,简 直和人类导师老卡尔有一拼。据说那个发明“多世界”的是他同事,你可以想见 这老家伙整天头脑里都转些啥。总之,当时听他谈蔡汀是云山雾罩的,不过现在 回过头看哈也没觉得有那么玄。 蔡汀是IBM培养出来的一位牛人。他的思路是,把“复杂性”概念也象“真”概 念那样,用形式化给做了。按他的说法,真是复杂性的一个子集。其实这玩意远 没看上去那么吓人。试举例说明之。比如你上街看见一漂亮MM。如果她穿一身红 衣服,很容易描述吧。可是如果她上身穿碎花带三角形小补丁外套,下身穿利维 牛仔裤带铁环膝盖处打水牛皮装饰,你就不是一句话能说清楚了吧?直观上讲, 复杂的东西需要更长的描述。 真理是简单的。蔡汀理论(CHAITIN’S THEOREM)就是说,没有程序能计算比它 自身更复杂的数!如果再现一系列观测数据的最短可能(SHORTEST POSSIBLE) 程序并不比观测数据本身更短,那么观测的数据就是“随机(RANDOM)”的。也 就是说,对这些数据不存在某种算法构造性的生成它们。让我们看看随机数。按 照蔡汀理论,一个数的复杂性可以用一台通用图林机打印出这个数的最短程序的 长度来定义。如果计算一个数的最短程序长度并不比这个数本身短,那么这个数 就具有最大的复杂性,就是随机的。有网友问,PI是不是随机的。回答是,不 是。因为PI可以用短短几行程序来产生,而PI本身可以无限长。这里的要点是, 所有的程序本身也可以形式化,用0或者1序列这样的UTM方式表示出来。这些大 概都是算法复杂性101课程的内容。顺便说一下,或许是英雄所见略同吧,方舟 女提的信息量子概念大概是在直觉上重复了蔡汀的研究。 如果把AI比喻成一个很难攻克的城堡,我们不妨离开一段距离,站在高空俯视一 下它的轮廓。蔡汀定理实际上是对我们人类认识世界的能力提出了一个上限。假 设K是我们关于物理、化学、生物等自然科学的最新知识总和,M是一台理想UTM (相当于最聪明的人,比如爱因斯坦的头脑)的能力,那么按照蔡汀定理,我们 现有的知识复杂性可以表示为: T = K的复杂性 + M的复杂性。 逻辑学家和科幻作家拉克估计:满足复杂性K的知识容量大约是1000本书,按照 每本书100万字节计算,在ASCII条件下,大概是80亿比特;要了解UTM的每件事 情,另外1000本书是可能的。因此,T将是个小于160亿比特的数。这就是我们现 在全部知识的复杂程度的上限。按照蔡汀定理,任何观测的数据复杂程度(UTM 上0或者1的长度)超出这个范围,我们都没办法构造出一个程序来证明这个观测 的真伪。对于这个观测,我们没法给出一个解释,就算有了解释我们也不能够理 解!超过160亿比特的复杂程度,就是超过了人类心智能明确解决它的界限。 (四) 上回说到,按照蔡汀定理,观测数据如果超出160亿比特的复杂程度,也就超出 了人类心智目前能明确解决它的上限。这个范围大致可以算做人工智能与人类智 能共有的一个界碑。 这回我打算聊点关于量子意识的话题,再次声明哈,只是抛砖引玉。 过去已经有人证明,神经网络模型的表达能力与传统的符号逻辑主义是等价的 (Radovan,1997),而对于符号逻辑主义方法也有人已经证明它不可能描述意 识现象(Caplain,1997)。于是,一个很自然的想法就是通过量子物理学方法 来进行关于意识的建模研究(Schweizer,1997)。有些理论和实验也支持这种 意识与量子系统相关联的主张(Lockwood,1989)。 这么做的主要理由如下: 1)量子系统是所有物理、化学、生物现象的微观基础。 2)量子系统独特的性质使人很自然产生它与意识有关联的想法。 比方说,量子波函数的坍缩是从众多的量子图式的叠加状态变换成单一的量子图 式,而与此对应,潜意识状态提升到意识状态也是一种选择性的映射。按照目前 一些理论的说法,甚至波函数坍缩本身也是意识作用于微观量子系统的结果。另 外,量子系统本质上是整体的(Bohm,1993),它们是以一种本质上不可分割的 并行方式相互起作用。这种整体性不可能被解释成基本元素之间的相互作用。与 此相对应,我们没有听说过一个人的意识可以被分成各部分之和。所以,意识本 质上也是整体性的。还有,量子系统的非定域性质与我们时而会体验到的“心灵 感应”相似。这是个很容易被人垢病的话题,不过据说有人有过这种超觉的体 验。对这个问题,见仁见智吧。 彭罗斯设想了一种量子系统与神经元结合产生意识机制,就是认为神经元的突触 上有某种“微管”。不过,现在还没有什么有价值的试验 来支持这个假说。总之,意识的量子模型可以说是很有意思的。它的最大好处是 可以突破一般的算法模式。如果把量子模型和神经网络模型结合起来,或许能产 生一些很有意义的研究成果。不过,我个人觉得这还不能作为意识起源的充分条 件。意识起源还需要某种更宏观的机制,比如某种改进的进化律。。。下回我讨 论这个。。。 (未完待续 欢迎讨论) 【虹桥科教论坛网友文库(www.rainbowplan.org/cgi-bin/edu/mainpage.pl)】