|
4楼

楼主 |
发表于 2007-5-26 06:46:07
|
只看该作者
[转帖]复杂性的刻画与复杂性科学
复杂性的刻画与复杂性科学(4)
作者:郝柏林 文章来源:本站原创 点击数:702 更新时间:2005-4-9
粗粒化描述与符号序列
科学研究不能从定义而要从对事实的分析出发。直观地看,从原子、分子、晶态和非晶态固体,到高分子、液晶这些“软”物质,到组成生物的“活”物质,乃至人脑、意识和思维,科学研究的对象确实是在沿着复杂性的阶梯上升,同时也变得愈益特殊。唯其特殊,才有丰富的内容。这再次提醒人们,复杂性的研究切忌泛泛议论。下面的观察,会有助于构造出分析复杂性的一种有效框架。 研究基本粒子结构的人,看见u、d、c、s、b、t这六个小写字母,会立即认出它们是六种夸克的名字,并且从字母联想到质量、电荷和其他性质。更多的学者用p、n、e这几个符号,表示质子、中子和电子,知道它们的电荷、质量、自旋、磁矩等特征,但并不关心质子和中子分别由那三个夸克组成。 化学家们看到H、C、N、O、P、S这些元素符号时,会想到它们的原子序数、离子半径、化学价和亲和力等等。看到用元素符号写出的化合物的分子式,如H2O、NO、CO2等,会联想到它们具有一定的分子量,是透明液体或无色无嗅气体。然而,即使在遇到还不算太大的核苷酸分子时,如果每次都把三四十个原子的元素符号写出来,则既不方便也无必要。 人们用a、t、c、g代表四种不同的核苷酸,更注意到它们在组成DNA双螺旋时,a和t由两个氢键相连,而c和g由三个氢键相连,分别称为弱偶合和强偶合。地球上各种各样生物的遗传基因都是由这四个核苷酸以不同的顺序排列“编码”的。小小的大肠杆菌的遗传信息乃是由4639221个符号排成的一个长字,其中只有a、c、g、t 四个字母,而人的全部基因分别组织在23对染色体中,估计有30亿个字母。一切蛋白质都是根据编码于基因中的信息在细胞中合成的。每个蛋白质是一条由20种氨基酸按特定的顺序排列成的大分子。单个氨基酸比核苷酸小一些,有10到27个原子,又可以用一个字母表示。胰岛素是一种相当小的蛋白质,研究其三维立体结构时需要知道上千个原子的位置,比较人、牛、猪的胰岛素时可以考察51个符号组成的大同小异的序列,讨论葡萄糖代谢过程时胰岛素又往往用一个记号代表。 这类叙述还可以继续延伸几个层次。倒过来说,“从头算起”,企图由夸克出发阐明生物圈,或者把宇宙称为一个“复杂巨系统”,都并未真正深化对自然界的认识,丰富人类的科学知识。 以上观察启示了一个深刻的研究纲领: (1) 研究自然现象时必须瞄准一定层次进行粗粒化描述。更精细层次上的差异,在所关注的层次中表现为某些特征量,例如热传导系数。 (2) 粗粒化描述不可避免地要使用符号和符号序列。很多情形下这导致一维符号序列。其实,对于有限个符号组成的序列,“高维”可以归结为具有远邻关系的一维序列。 (3) 符号序列可以自然地纳入“形式语言”的框架。形式语言有别与我们日常使用的“自然”语言(后面再稍详细地介绍)。 (4) 形式语言可按语法复杂性的阶梯分类,各种符号序列的具体研究又能丰富语法复杂性的内容。 应该强调,以上所述只是一个研究纲领,而非已经完成的建筑。迄今为止,这个纲领只是在动力学问题中实现得较好,在与生命有关的符号序列上有所尝试。 形式语言和语法复杂性 先简单介绍一下语言和语法复杂性的概念。首先要有一个特定的字母集,例如前面提到的R和L两个字母,或者0和1两个数字,都可以构成两个符号的字母集。26个大写和小写罗马字母,加上13个标点符号,可以构成65个符号的字母集。字母集里面的符号,本身不再具有任何含义。通常考虑由有限个符号组成的字母集。取给定字母集里的符号,组成一切可能的符号串,包括不含符号的空串,它们构成有无穷多元素的大集合。这个集合的任何一个子集合,称为一种语言。这就是形式语言的定义。 从如此普遍而抽象的定义出发,走不了多远。必须指出,所关心的语言是由那些字符串或“字”组成的。有限个字组成的语言原则上可以用穷举法描述。有些无穷语言也很容易表述,如集合{RnLn,n≥1}就是一种基于字母集{R, L}的语言。更有效的办法是,指定一个或几个初始字母和一组“生成规则”,把生成规则反复使用到初始字母和新生成的字上,产生出整个语言。这就是由“生成语法”定义的语言。 生成规则可以是串行或并行的。乔姆斯基(N. Chomsky)在20世纪50年代给出了串行生成语法的完全的分类。原来一切串行生成的语言,包括人们熟悉的许多程序设计语言,可以分成四大类,每类语言可由一类自动机来接受(或者叫执行、识别): (1)正规语言(RGL),由不需存储器的有限自动机接受。 (2)上下文无关语言(CFL),由带堆栈(又称后进先出区)存储器的计算机接受。常用的算法语言,例如FORTRAN,就属于这一类。 (3)上下文有关语言(CSF),由存储器容量比例于输入量的“线性有界自动机”接受。 (4)递归可数语言(REL),由存储器无限大的图灵计算机接受。 从上往下的分类,给出了由简单到复杂的乔姆斯基阶梯。由物理观察经粗粒化所得的符号序列,如果可以阐明其生成语法,就有了一个有严格数学背景的复杂性尺度。乔姆斯基阶梯并不是一成不变的标准。对具体问题的具体分析,往往可以丰富其内容,在某些阶梯中作出更细的划分。 不难看出,一维抛物线映射中的周期和最终周期轨道,对应最简单的正规语言。最近,我国学者谢惠民等证明了更困难的逆命题,即对应正规语言的轨道只有这两大类。许多对应正规语言的轨道族的极限,例如倍周期分岔序列的无穷极限,跳过上下文无关语言,达到上下文有关语言的复杂程度。于是出现猜测:一维抛物线映射导致的符号序列中没有上下文无关语言。还可以引用语法或自动机的更细致的性质(例如,允许字或禁止字的数目、有限自动机的结点数目,特别是它们的增长速率),来比较符号序列的复杂程度。符号序列的演化可以用转移矩阵描述。无穷大的转移矩阵的块结构,提供考察超出正规语言复杂性的另一种途径。于是,关于抛物线映射中轨道复杂性分类的知识,已经大为超过90年代初期的水平。对这些进展感兴趣的读者,可参阅文献[11]和[12]。 20世纪60年代,荷兰发育生物学家林登梅耶(L. Lindenmayer)观察了某些多细胞藻类植物的发育过程。其中有种项圈藻属的串珠藻(Anabaena catenula),它的细胞具有分裂方向的极性。小细胞长大后进行分裂,把极性传给新出生的小细胞,自己的极性反向,下一次在另一头分裂出一个小细胞。这样,从一个具有某种极性的小细胞开始,若干次分裂后就成为一株大小和极性具有特定排列图案的项圈藻。林登梅耶用4个字母代表极性向左向右的大小细胞,写下它们之间的变化规则。反复使用这些规则,得到的结果同显微镜观察完全一致。不久,人们认识到这种做法可以推广成一套并行生成语法,并对它进行了分类,得到不同于乔姆斯基的另一种形式语言分类体系,特称为L系统。L系统很可能对生物学问题有更多应用。 林登梅耶分类中较为简单的一个层次,可能跨越乔姆斯基分类的几个复杂性阶梯。有些看起来“简单”的语言,可能处于相当高的复杂性层次。例如, {RnLn,n≥1}不是正规语言,而是上下文无关语言,{RnLnMn,n≥1}进而达到上下文有关语言。这从另一个侧面说明前文的论断,即不存在复杂性的绝对度量。形式语言的分类,当然也不限于这里介绍的两个体系。 对具体问题作具体分析,是科学知识的源泉。许多普适性的概念,例如分形、混沌、信息,复杂性,有助于整理研究结果,却不能代替具体研究[13]。用“新”名词包装,造不出科学成果,何况许多“时髦”名词并不新鲜。逻辑学中关于概念外延与内涵成反比的定律,说明创立大而无当的空洞体系的种种企图,不会导致具体和有益的科学知识。在现代科学和科学方法论基础都十分薄弱的中国,人们应该警惕不要受这样的“新学科”的诱惑而误入伪科学的泥沼。 (文中提及的本文作者的研究受到国家自然科学基金和攀登计划的支持。)
参考文献
[1] Prigogine I , Stengers I . Order Out of Chaos . London: Heinemann, 1984.104;中译本:普里高津,斯腾热尔.从混沌到有序,人与自然的新对话.上海:上海译文出版社,1987
[2] Nicolis G,Prigogine I .Exploring Complexity.New York:W H Freeman & Co,1989;中译本:尼科里斯,普里高津.探索复杂性.成都:四川教育出版社,1986
[3] Anderson P W. Physics Today, 1991(7): 9 ;1992(6): 9
[4] Waldrop M M. Complexity: The Emerging Science at the Edge of Order and Chaos. NewYork: Simon and Shuster, 1992;中文缩译本:复杂, 诞生于秩序与混沌边缘的科学. 北京: 生活·读书·新知三联书店,1997
[5] Lewin R. Complexity, Life on the Edge of Chaos. Macmillan, 1993
[6] Casti J L. Complexification. Harper Perennial, 1994
[7] Holland J H. Hidden Order: How Adaptation Builds Complexity. Addison-Wesley, 1995
[8] Horgen J. Scientific American, 1995, 272(6): 104
[9] 可参看:郝柏林.从抛物线谈起——混沌动力学引论. 上海:上海科技教育出版社,1993
[10] 1985年创刊的Journal of Complexity基本上是一份讨论计算复杂性的刊物.
[11] 关于乔姆斯基和林登梅耶分类的介绍和引文,参见:Huimin Xie (谢惠民).Grammatical Complexity and One-Dimensional Dynamical Systems.Singapore:World Scientific,1996
[12] Bai-lin Hao (郝柏林),Wei-mou Zheng (郑伟谋).Applied Symbolic Dynamics and Chaos.Singapore:World Scientific,1998.Chapter 8
[13] 读本文校样时,见到Science的一个关于复杂系统的专辑(1999年4月2日出版),其中涉及的正是这类“具体研究”.
|
|