|
肖红先生医案(述评)
Focus on Semantics
个人介绍
电子教案
学术论文 学术报告
诗歌散文 摄影作品
游戏娱乐
回到主页
首先,要搞清楚什么是概念。
不论是在语言学家那里还是哲学家那里,概念都是不可直接定义的。只有为了某个应用的目的,定义某个具体的概念或概念的某些方面。从一个方面看,词语的使用(或定义)过程中是先有了某个具体的概念(并且这个概念有一定的使用率),我们才会选择(规定或创造)一个词语在特定的语境中去体现这个概念;从另一个方面看,语言分析中词语比概念更客观,也就是说必须先接受到词语才有可能判定出它所体现的概念。所以,概念的表达以词语为载体并不依赖于先有概念还是先有词语。我们无法脱离词语谈论概念,对文字语言,词语是文字化了的概念。理论上,概念的个数是潜在无穷的,有许多概念单纯依靠词语很难表达清楚,只有通过语境的约束才能明确该语境中的词语w 所体现的概念。一个词语可以承载多个概念,一个概念也可能由多个词语来体现,即词语集合W 与概念集合C 之间的对应关系是多对多(不是映射)。概念之间的联系与词语之间的联系的关系是我们所关心的:词语之间的联系可以通过它们在言语中的表现被澄清,而概念之间的联系则必须通过词语之间的联系抽象得到。
问题转化为:词语之间的哪些联系(作为聚类标准[1])是主要的、可形式化的?不论对人还是对机器,理解词的方式就是词义的定义方式。Russell在 Logic and Knowledg中描述了人类理解词的四种方式,从心理语言学的角度澄清词与词的意义之间的关系:
在适当的时候恰如其分地使用该词;
听到或看到该词时能够合适地行动;
由词w联想到另外一个词w',而w'对行为有适当的效果;
将词与具有其意义的对象联系起来,使得词部分地获取与对象相同的因果效应。
Russell吸收了Wittgenstein的某些观点,把词的意义等同于词的使用[2],这为概念的形式化扫清了哲学障碍。自然语言理解可以不考虑第四种方式:后面的讨论将揭示第一和第二种方式在WordNet和CCD中的模拟,而MindNet和HowNet则更关注第三种方式的刻画。
对某个概念(尤其是一个学科中的基本概念)的不同理解,可能导致不同的学派[3],更何况对概念的不同理解!哲学家和语言学家一直在研究概念的定义(把概念的各个方面都搞清楚)和概念体系的构建,受Russell和Whitehead的《数学原理》和Frege思想的影响,Carnap在Der Logische Aufbau Der Welt中试图提出自然语言的概念构造体系,该体系包括了:
把概念区分为不同的种类;
研究各类概念的区别和相互关系;
从某些基本概念出发逐步地构造新概念,从而产生一个概念的谱系。
Carnap似乎更关心(3),因为它常常被语言学家和哲学家所忽视。事实上,(1)和(2)早在Aristotle的《范畴篇》中就有论述。传统的语言学理论对概念的分类和概念之间的关系的认识只限于本体论,这导致概念体系的构造与这个概念体系的实际应用相互分离。从逻辑的观点看,动词通常充当谓词,其变元可以为名词的聚类提供依据;同理,名词的n 元组也可作为n 元动词的聚类的标准。由于谓词可以由非动词的语言成分充当,所以名词的聚类并不仅仅以动词的变元为依据,例如由亲属关系所聚合的名词集合{父亲,母亲,祖父,祖母,姨夫,姑妈,……}。关于某个给定词性的词语的聚类的研究,无非是想对该词性的词语做一个等价分类。W 上的非平凡的、有效的等价关系很难定义,所以对W 的划分就无从谈起[4]。
自Wittgenstein以来,越来越流行的观点是将概念作为对象的功能化(在这种意义上概念和对象可以视为同一个东西)。外延(指称)和内涵(意义)是概念的两个对立统一的表现,在Frege那里就已经搞清楚了[5],二者对于概念体系的构造应该同等地重要。概念定义的“外延(类或关系)方法”与“内涵方法”各有特点---前者是属于模型论的,而后者属于内涵逻辑。一旦区分了意义理论和指称理论,意义理论所要研究的首要问题就仅限于语言形式的同义性[6]和陈述的分析性,而意义本身则丝毫不重要了。以此观点为哲学基础,以下三个基本问题就可以有若干个不同的回答,这是由对语言形式的同义性的不同理解造成的。
什么是一个语言L中的概念?
什么是词语w的词义?
概念与词义之间的关系?
Frege在Grundlagen der Mathematik (1884)中提到,一个词的语义应该在某个语境[7]中被确定,而不应该孤立地分析。所以,我们将w 的词义等同于它所有可能承载的概念的集合。词汇语义信息的获取,在传统语义词典的构造中多依赖于词典编撰者的语言学知识。这些知识的表示存在不稳定性,其原因很复杂:姑且不论不同的词典编撰者能够引起知识表示的混乱,即便对一个编撰者而言,在不同的时期所表现出的知识也会有明显的不同。词典规模越大、词典结构越复杂,这种知识表示的不稳定性就越突出。克服词典构造的这个天生缺憾有一些成熟的方法,除了在词典构造时引入必要的词典结构的形式检查和知识表示的直观检查之外,还需要一些外在的语言资源(譬如,百科知识)作为辅助,将词典与它的具体应用联系起来。概而言之,计算词典学主要解决在某个词汇语义的框架内如何实现词典到语法的形式映射的问题,词典设计者应该至少完成下列目标:
语义范畴的分类;
一个词语所有可能的解释;
从有限多个表达式的语义的形式描述演绎出潜在无穷多个的复合表达式的语义的形式描述;
动词变元的闭合语义约束;
以动词概念为中心的语境的框架描述。
其中,计算词典学所涉及的计算方面包括:
复合表达式的解释(Frege组合性原则在给定语境下的应用);
(概念之间的)继承理论;
语义知识的自动获取[8];
在复杂度允许范围内的词典结构的动态维护[9]。
词典结构的形式刻画依赖于词典的应用范围---普适的语义词典要么是不可能实现的,要么以复杂度过大为代价。从自然语言理解的角度看,语义分析不可避免地要牵扯某个逻辑系统,因而推理规则应该部分地附加在词典结构上。X=<S,T,R> 是一个动态词典,如果
S 是由W 诱导出的一个结构化的集合;
T 是S 上的所有变换的集合,满足对S 类型的封闭性;
R 是S 上的所有演绎规则的集合。
WordNet和CCD用同义词集合(SynSet,即在某个特定语境中可以相互替换而不该变语义的词的集合)表示一个概念,这是WordNet和CCD的核心,常用来区别于其他的语义词典。在WordNet和CCD中,概念之间的上下位关系是词典结构中的主关系,也就是说,在概念标记树的基础上附加其他的关系(如,对立关系、部分整体关系等)构成整个概念网络。而MindNet和HowNet则将词语w 所在的网络视为w 的词义。
Quine在From a Logical Point of View中论述了Leibniz的可替换性原则是认识同义性的充分条件。但是,判定两个语言形式的同义性完全是后验的,必须存在足够数量的可能语境使得可替换性原则得以验证。传统的词汇语义学定义语言形式的意义,同义性的判定可以归结为定义的比较。首先,这个方法的自由度太大,将使得语言理论的论述复杂度增加;其次它容易导致循环定义。一个折中的解决办法就是使用受限的(restricted)定义,而这个受限词汇集的获取又要依赖于同义性的判定。当我们说两个普遍名词w 和w' 是同义的恰恰等于说在某个给定的语境中下面的陈述是分析的:所有且只有w 是w' 。专名在可能世界里有具体的所指,如亚里士多德、天安门、……,而一个普通名词w 则指代一个集合(w 的外延语义),CCD区分了这两类名词概念。在名词概念集合Cn 上可以定义各种满足不同条件的关系。继承性可以用特征结构形式化,偏序关系刻画了信息之间的蕴含(特征结构的 subsumption)。
--------------------------------------------------------------------------------
[1]WordNet和中文概念词典(CCD)将词语之间的同义关系(由可替换性原则来判定)视为词语聚类的标准,MindNet和HowNet则采用其他的解决方案。
[2]这个观点可追溯到Leibniz,在New Essays on Human Understanding中他说,“……,而我毫不怀疑,一个瞎子也能确切地来谈论颜色,并且作一篇成本大套的演说来颂赞他所不认识的光,因为他曾学会了解了它的效果和有关的种种情况”。事物和观念都是用词语来标志的,Leibniz认为二者没有什么不同,“人们有时甚至就实质性地谈到词语,而在这种场合不能确切地以词语的意义、词语与观念或事物的关系来代替词语;这种情况不仅当人们作为语法学家来说话时是这样,而且当人们作为词典编撰者来说话,给名词以解释时也是这样。”
[3]例如,二十世纪初的数学基础之争,就是源于对诸如“集合”、“无穷”等概念的分歧。
[4]语言是从暗示物体具有一种确定的、分立的和看来好象具有永久的性质开始的,这个假设事实上没有任何理论基础,完全是一种为使用方便而作的约定。
[5]外延相同并不能推导出意义相同,譬如晨星和暮星,有心脏的动物和有肾脏的动物等等。
[6]对同义性的定义方式就是对意义的理解方式。
[7]一个语境可以是认为是一个若干合法语句的集合。
[8]从现存的大百科全书或汉语词典中提炼结构化的语义知识,例如上下位关系、对立关系等等。显然,词汇关系在词之间体现,语义关系在概念之间体现,关键的问题还是从功能出发给概念一个定义。
[9]在词典的动态维护方面,计算词典学还关心经过一些特定的操作后所得到的同一类型的词典与原始词典的关系,简单地说,就是词典的演化问题。这个演化通常是针对词典结构而言的,如果将词典结构的描述语言也包括在内,问题将变得更复杂。Quine在From a Logical Point of View中说,“概念和语言的目的是在交流和预测上的功效”,这种实用主义的知识观必然导致概念体系的后验评价标准是一个实用系统。
|
|