- 2022-08-11 发布 |
- 37.5 KB |
- 14页
申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。
文档介绍
计算语言学对理论语言学的挑战
语言文字应用1992年第1期(总第1期)计算语言学对理论语言学的挑战冯,怎伟计算语言学是采用计算机技术来研究和处理自然语言的一门新兴学科。计算语言学对自,:然语言的研究和处理一般应经过如下三个方面的过程,,第一把需要研究的问题在语言学上加以形式化(li11gtlisticforlnalism)使之能以一定的,;数学形式严密而规整地表示出来,,。-第二把这种严密而规整的数学形式表示为算法(algorithm)使之在计算上形式化(cmPtltatiol飞alformalism);,,(。ot;te:oe;ltat。:1。第三根据算法编写计算机程序使之在计算机上加以实现mpimplmi),,,,因此为了研究计算语言学我们不仅要有语言学方面的知识而且还要有数学和计算机科学方面的知识。这样,计算语言学就成为了一门介乎语言学、数学和计算机科学之间的边缘,、。性的交叉学科它同时涉及到文科理科和工科三大领域。,计算语言学的研究是从机器翻译开始的1946年电子计算机刚一问世人们在把计算机,广泛地应用于数值运算的同时也想到了利用计算机把一种或几种语言翻译成另外一种语言。,,或几种语言从50年代初期到60年代中期机器翻译一直是计算语言学研究的中心课题当“”,,时采用的主要是词对词翻译方式这种不是建立在对自然语言理解的基础上的简单技术没。,人们、有得到预期的翻译效果60年代中期开始转入对自然语言的语法语义和语用等基本问,。,题的研究并尝试着让计算机来理解自然语言许多学者认为断定计算机否是理解了自然语,,言的最直观的方法就是让人们同计算机对话如果计算机对人用自然语言提出的问题能作出,,,“”“”回答就证明计算机已经理解了自然语言这样就出现了人机对话(或自然语言理解)的研究。计算语言学的理论和方法也就在这些具体的研究中逐渐形成、成熟并完善起来。目前,,口、语除了机器翻译和自然语言理解之外计算语言学的研究领域还扩展到了自然语言人机接音自动识别与合成、自然语言情报检索、术语数据库、风格学研究等领域。计算语言学已经在世,。界范围内引起了广大学术界的瞩目成为了一个独立的学科它象一股强劲的东风吹进了传统,。的理论语言学的许多部门使这些部门面目一新。,计算语言学对传统的形态学提出了新问题在机器翻译和人机对话的研究中都要进行形,。l态分析这就促进了形态学的研究传统的形态学都要区分屈折(illfctiol)和派生e。,,(drivatio:1)ame;ld/anle;ided是屈折al:c,ld/ameme;it如英语的耐是派生前者作为词形变,。,。化看待后者作为构词法问题看待然而对于计算机来说并没有必要一定要作这样的区分通·84·语言文字应用\nao。mllded和amem。am常是把ndnt都归入el记进行统一的处理一个自动形态分析方案可包,,。,括一部词干词典和一套描述词形变化和构词的规则系统其中既有派生也有屈折这样在分,,,,析时给出词干计算机就可以自动地列出它的所有的变化形态而给出一个变化形式计算机就可以自动地把它切分为词干、词缀和词尾。计算机还要求区分各种同形现象,例如,英语,frighte:飞中的一。;1要与oven中的一el:区别开来reaped中的一ed要与reed中的一ecl区别开4。,。、、-来另外还要考虑一些特殊的现象如performglveg。等动词的过去时形式分别为pero、、,,,frmedgavewe,,teity的复数形式eities在去掉词缀之后还要把词干的形式作些改变编写,。形态分析程序时应该设法使这些各不相同的情况条理化在机器翻译欣欣向荣的50年代末,、,和70年代初学者们曾经对俄语德语这样一些屈折变化丰富的语言进行过严格的形态分析编制过相当精细的自动形态分析规则。目前,在机器翻译和人机对话中的自动形态分析技术已经十分成熟。,计算语言学对于传统的句法学冲击最大各种立足于自然语言自动处理的句法分析理论和,。方法犹如雨后春笋应运而生形成了百花齐放的局面在机器翻译研究的早期,苏联数学家库拉金娜(0.c.Ky几八rHH八)就用集合论方法建立,,了俄语句法的数学模型精确地定义了一些语法概念这一模型成为了苏联科学院数学研究所.。(。r和语言研究所联合研制的法俄机器翻译系统的理论基础著名数理逻辑学家巴希勒YB一,,(catogorygrammar)Ililel)提出了范畴语法建立了一套形式化的句法和演算规则通过有穷,。,、步骤可以判断一个句子是否合乎语法这些都大大地推动了传统句法分析方法向精密化算法化的方向发展。。乔姆斯基的形式语言理论是影响最大的早期计算语言学的句法理论乔姆斯基定义了。型语法、上下文有关语法、上下文无关语法和正则语法4种类型的形式语法。其中的上下文无口lrasestrtletureraar,。关语法又Ll做短语结构语法(plgmm简称PSG)这种短语结构语法广泛地应用于自然语言的自动分析和生成中。但是,人们不久就发现,短语结构语法的分析能力不,,,高难以区分大量的歧义句子短语结构语法的生成能力过强往往会生成大量的不合语法的句子。就是乔姆斯基本人,也认为短语结构语法不能充分地描述自然语言。于是他提出转换语法来克,。,服短语结构语法的这些弱点后来转换语法逐渐发展成为转换生成语法不过这种生,。成转换语法的分析效率也不高并没有在实际的自然语言处理系统中受到欢迎山于短语结构,,,,语法结构清晰易于操作计算语言学的学者们抛弃了转换生成语法又转向短语结构语法于。,是出现了各种增强的短语结构语法例如受限语言(restriotedlalguage)和扩充转移网络a“e,‘tera,lsonnetor,。(g“mdtitiwk简称ATN)受限语言的表层结构分析和深层结构生成是分,而。,别进行的ATN的表层结构分析和深层结构生成是同时进行的60年代后期查斯特里,、asor(Cltcli)把程序设计语言的W一语法引进了自然语言处理中他证实了英语和法语的转换语法都可以通过这样的W一语法来重写。.,r美国语言学家布列斯南(JBeslal)主张建立面向词汇的非转换的语法她和卡普兰一,,。·起于2983年提出了词汇功能语法(lexieal一f川letio,:algra,lmar简称LFG)马T凯依于“”uneatoliraar,,“1983年提出了合一语法(ifiigmm简称UG)于1985年提出了x)J能合一语,。.、.、”t、:1。to:lau:lifieatol、araarazare:1法(fililgmm简称FUG)盖兹达(GGd)克莱因(EKli)沙..“”格(1Sag)和普鲁姆(Gpull::m)等人于1985年提出了广义短语结构语法(generalizod,。.,pl‘rasestructuregrammar简称GpSG)于自拉德(cpollard)于1954年在他的博士论文中提2992年第i期·85·\n“”earaar,“出了中心词语法(hdgmm)1985年又和他的同事们一起提出了中心词驱动的短语”、earvenrasestruetureraar,。结构语法(ld一diphgmm简称HPSG)这些语法都采用了复杂特,,征结构来改进短语结构语法采用合一运算来改进传统的集合运算从而有效地克服了短语结,。构语法的缺点保持了短语结构语法的优点理论语言学中的层次分析法实质上就是短语结构语法,,因此短语结构语法在计算机分析和生,。成自然语言时出现的各种问题在层次分析法中也同样是存在的上述的这些旨在改进短,,,语结构语法的计算语言学理论都带有很强的可操作性具有强烈的方法论色彩必定会有助于理论语言学中广泛使用的层次分析法的改进和完善。在这方而,我们应该提倡理论语言学家,互相学习对方的长处,和计算语言学家进行经常的对话共同来解决短语结构语法在应用中出现的各种问题。,。计算语言学对句法学的如此巨大的影响使我们想到了建立汉语产生式语法的问题不论,、,那一种计算语言学的语法其最根本最关键的问题是要指出各种语言形式出现和,,,,变换的条件只有指出了条件计算机才可能根据有关的条件执行相应的动作从而使整个系统成为一个可以动态地执行的过程。,,,,不论那一种计算机在执行有关程序时总免不了给它指出条件有了条件并且让计算机‘。,,总而言之,知道究竞是什么样的条件计算机刁可能执行相应的动作计算机的任何操作归根,:结底可以归结为一个公式条件~动作,,,。“即在一定的条件下执行一定的动作在另一条件下执行另一动作这样的条件一动”,,,作偶对是一切计算机工作的最基本的方式因此要使自然语言的语法规则成为可供计算机,。执行的形式我们就必须指出各种语法现象出现的条件,我国计算语言学的学者们多年来从事中文信息处理的研究工作曾经提出了一些自然语,,,言处理的算法但是在很长的时间内山于我们对于自然语言形式化处理的关键问题不十分,,,,,,清楚所以这些算法有的成功了有的失败了凡是成功了的算法都是由于我们比较充分地,,研究了语言形式出现的条件凡是失败了的算法或者是山于我们根木没有提出语言出现的条,,、,件或者是我们虽然提出了语言形式出现的条件但是条件给得不具体不精确或者是条件给。,,“”,错了积多年之经验我们深知条件对于建立计算语言学语法的重要性条件一动作偶对确实是建立计算语言学语法的最基本、最关键的公式。由于汉语中单词或词组的种类与它们的句,法功能之间没有明确的对应关系语言成分的句法功能与它们的语义关系之间也没有明确的,,,“”,对应关系所以在汉语的计算语言学中认真研究现代汉语的各种条件一动作偶对就显得更加重要了。,我国汉语语法研究已取得很大的成绩尽管过去的汉语语法研究没有专门考虑到计算语,,“”言学的需要但是汉语语法的许多研究成果都是自觉或不自觉地体现了条件一动作偶对这,,。一公式的原则因此这些成果都程度不同地能够在汉语的计算语言学中得到运用,,“”例如我们在进行汉语的自动生成时起初以为把字句的作用是把及物动词的宾语提,,,,前其实这是一个极不严格的条件我们把这样的条件写到程序中凡是及物动词的宾语都用“”,。,」巴字提前了结果形成了通篇的把字句实践使我们认识到把字句的出现条件不只是及物,,,动词的宾语提前还有着更为严格的条件进一步学习汉语语法研究的有关文献我们加上了:“”,,如下限制条件¹把字组成的连动结构其中的动词不能是单纯的单音节或双音节动词而.8.6语言文字应用\n;“”,是一个比较复杂的动词组合º把字的宾语在语义关系上是后边动词的受事而不是一般的;“”、。宾语»把字的宾语在意念上是确定的特指的,根据这些规律对把字句的出现条件作了进一步的限制结果计算机生成的把字句荃本上正确了。,,,后来我们根据汉语语法研究的有关结果把上述条件进一步加以概括得出这样更简练:,“”。,“”、“”、的规律凡是受事主语句的主语之前都可以加把字形成把字句例如门开着门关了,“”,“”“”、“”、“他免了职等受事主语句主语前加把字就可以形成把门开着把门关了把他免了”。,就职等把字句找出了这样的概括性更高的条件能更好地通过简单的程序来有效地控制把字句的生成了。,。其实人学习语言的情况与计算机处理语言的情况有许多相似之处一个学汉语的外族人,他必须知适汉语的各种语法现象的出现条件,刁‘有可能去正确地使用它。现代英语语法对,,,于动词的各种时态的出现条件作了比较确切的说明因此学习英语的人可以很快地掌握它从而造出各种合乎规范的句子来。在学习英语时我们之所以觉得英语语法十分有用,非学不,。,可就是因为这样的语法是一种讲条件的语法有的人之所以觉得汉语语法无用是因为大多,。,数汉语语法书只罗列现象很少讲这些现象出现的条件山此观之不论从计算语言学还是从,,。外族人的汉语教学来说建立一套讲条件的汉语语法就成为一件十分重要的事协了,,50年代末60年代初美国描写语言学的方法介绍到中国来之后我国现代汉语研究受到,,美国描写语言学的影响比较注意语言现象本身的详尽描述而不太注意对这些语言现象的解释。描述语言学现象是完全必要的,而且这是语言研究不可缺少的第一步。如果不详细地占有,、,,语言材料不从各个方面各个角度来描写语言现象当然也就谈不上对语言现象的解释语法研。,,,究就有如做无米之炊但是如果只停留在描述的水平不进一步对这样的描述作出解释那还不能算是探究了学问的根本。从应用的角度来看,如果不对语言现象的出现条件作出解释,这样的描写对人们学习语言的实践以及计算语言学的研究就很难发挥应有的作用。为了使汉,,语的研究更好地为我国的四个现代化事业服务有必要把汉语语法研究的重点逐渐地从描写的立场转移到解释的立场上来。语言研究者应该进一步钩深致远,尽其所能地把他们所描写的,,,各种语言现象的出现条件说清楚不但要说明语言现象是什么样而且要说明条件解释这些,。现象何以会这样从而建立解释性的汉语语法体系,,我们主张建立解释性的汉语语法体系一点儿也不意味着要削弱汉语描写语法的研究恰,,。,恰相反我们还要进一步描写汉语的各种现象揭示各种语言现象之问的细微差别但是我们,,,,作描写研究的目的不是为描写而描写而是要对这样的描写作出解释说明其出现的条件使,。这样的描写成为人们可以通过智能活动掌握的东西成为计算机可以使之程序化的东西...“”HASimol飞)和列维尔(ANowel)提出了美国人工智能专家塞蒙(产生式系统,。,(I)rod、,。tiol飞system)并论证了这种产生式系统与智能活动的关系他们认为智能活动可以,:分解为一系列最基本的单位这些基本单位可以归结为两种,;第一根据某种环境采取某种行动,。第二根据某一前提作出某种结论“”,,所谓人们有智能就意味着人们能够根据某种特定的环境产生某种行动或者根据某一。。特定的前提产生某种结论这种基本智能活动的单位就「】片做产生式山这种产生式可以构成一系列比较复杂的认知过程。人类社会的许多科学和文学杰作,最1992年第l期087.\n后都。,可以归结为这样的产生式从人类进化的过程来看是由一些简单的产生式系统发展成复;,,杂的产生式系统从一个人智能发展的过程来看先由发展简单的产生式系统开始逐渐发展,而,。到复杂的产生式系统这两条脉络的共同基础就是上述的产生式“”,把产生式系统的理论同前面提出的条件一动作偶对的那种观点相比较可以发现它们,,,之间是多么的相似!由此可以看出既然人类的智能活动是建立在产生式的基础之上的那么,,要把语言这种人类的复杂的智能活动形式化其最关键的问题当然就是要为某种语言建立起“”;,,一系列条件一动作偶对的产生式系统要使语言便于人们学习或掌握其最根本的问题当。,然也就是要告诉人们如何根据特定的条件来运用语言中的各种规则所以解释性的汉语语法。,应体系实际上就是汉语语法的产生式系统建立汉语产生式语法该是汉语的计算语言学在句法研究方面的最重要的任务。,,70年代以来国外建立了一些立足于语义的自然语言理解系统使长期不受重视的语义,。学得到了发展计算语言学也影响到了语义学方面,,,近数十年来不少语言学家认为语义学不应该是语言学的一个分支他们只关心语言的,。,形式研究而把语义的研究推给哲学或其它学科去进行但是随着机器翻译和自然语言理解,,。研究工作的进展再加上语言学理论论战的需要促使语言学家去研究语义学通过研究的实,,,,践学者们逐渐认识到甚至句法的研究也是不可避免地与语义学纠缠在一起的因此他们又,。重新对语义学发生了兴趣并且这种兴趣迅速地与日俱增,、、a:l、哲学家们曾经提出过意义公设系统它包括规则系统蕴涵符号(一>)逻辑连词(d。r、n,,。ot)等这样便可以把词的意义分解为若干个基本意义组成的意义公设系统在意义公设,。,系统中词的意义可以由一组语义公设来确定哲学家们这些研究为计算语言学中的语义研。....-,一些语言学家,AF)和玛考利(JDMc究打下了基础在这种情况下如美国的弗托(Jodor。Catley)等又把语言和逻辑相互关系这样的问题重新提了出来乔姆斯基关于表层结构和深层.,,kat:)和弗托等提出了解释语义学,结构的理论把语义问题提到了相当的高度卡茨(J采用,、,成分分析法利用语义成分标记和关系来定义词符成分并加上一些控制和选择限制来演绎。。..e地解释句子的语义这样的研究对于计算语言学很有帮助菲尔摩(CJFilmor)提出了格语。asegrammar),,法(从句子的深层句法表示来推导句子的表层结构较好地解决了句法与语义。,,而且与,相结合的问题格语法规则产生的结构不仅与句法相关语义相关给计算语言学的研,,。究提供了方便格语法在计算机上的分析效率也比较高受到了计算语言学家的欢迎玛考利,,等提出了生成语义学他们一开始就用语义结构来描述句子然后通过一系列的转换由这种语,。..s义结构产生出表层结构而用不着对深层结构作任何说明威尔克斯(YAwilk)提出了优eereeseas,。选语义学(Prflcmltic)并把这种理论用于机器翻译系统的研究中美国数理逻辑学.,者蒙德鸿(RMo:itague)提出了蒙德鸿语法(Mo:itaguegrammar)美国计算机科学家杉克..,(RCSehalk)提出了概念依存理论(eoneeptio:laldepe:,deneytheory,CD理论)简称美国人工智能学者西蒙(R.F.Simmols)提出了语义网络理论。这些理论都十分强调语义的作用,在,CD理论),,计算语言学的应用中有的理论(如直接以语义模型制导辅以句法检查打破了以,,。句法模型制导辅以语义检查的传统格局实现了自然语言处理的句法语义一体化r,—美国学者汉德雷斯(rlaldes)在描述一种语言的过程时把大量的语义信息植入该语言,“”seaCraar。的句法中这样定义的句法系统叫做语义语法(mltigmm)语义语法提高了自然语,、。言的处理速度效率较高后来被许多实时处理的自然语言系统所采用·88·语言文字应用\n,,。近年来由于语义学与句法学的联系日趋密切逻辑语法有了很大的发展逻辑语法,(aarlogicgrmm)是指用谓词逻辑来表达的语法它是逻辑程序设计和计算语言学相结合的产。,经常物在机器翻译和自然语言理解的研究领域里使用谓词逻辑来描述知识和进行逻辑推。,理70年代以来萄罗辑以PROLOG语言作为形式被应用于程序设计谓词逻辑就不再仅仅用,。-于描述知识和逻辑推理的问题还作为逻辑程序设计的工具来描述解决问题的过程PRO、LOG悟言使得逻辑和程序设计这两个相距甚远完全不同的概念协调统一为一个单独的概念。,逻辑程序设计在用PROLOG语言来解决计算语言学的各种问题的研究过程中逻辑语—法日益成熟起来。目前主要有4种影响较大的逻辑语法:定子句语法(defi:lite。lausegram-,,,,mar简称DCG)外位语法(extrapositio:1grammar简称XG)修饰成分结构语法(modifiersrueureraar,,resrenoeraar,。ttgmm简称MSG)约束逻辑语法(titiglgigmm简称RLG)这些语,,法巧妙地把逻辑和句法结合起来使描述性的形式语法具备了推理的能力这是计算语言学研究中应该注意的一个问题。。..arol)和佩瑞拉(Pea这里特别值得一提的是定子句语法这是瓦楞(DWPreir)于198。。:年提出的一种仅仅使用短语结构语法规则的逻辑语法定子句语法的基本思想是语法中所用,。,的符号不仅仅是原子符号还可以是广义的逻辑项例如短语结构语法的规则,sellteneenotl一飞一、raseverrase冷plb一ph,,表示一个句子由名词短语和动词短语两部分组成在定子句语法中同样的这个规则可以:,,。表示如果存在一个名词短语和一个动词短语那么就存在一个句子的推理过程短语结构语,,法的规则与定子句语法的规则在形式上虽然有许多相似之初但是在本质上却有很大的区别短语结构,。,语法只是用于描述一种语言而定子句语法则可以用来进行语言的推理这样定子,句语法便实现了从描述性的形式语法到推理性的逻辑语法的转变从而使短语结构语法产生了质的飞跃。,由于定子句语法的符号是逻辑项这就使得定子句语法规则中的非终极符号可以携带有、、,。而关上下文转换结构等多方面的信息增强了短语结构语法描述自然语言复杂特征的能力且,定子句语法规则的右部不仅可以为终极符号和非终极符号,还可以携带测试条件的信J它、,便于描述自然语言的规律。这样,定子句语法虽然在形式上采用了短语结构语法,但它的描述能力已经相当于乔姆斯基提出定义的0型语法了。所以,定子句语法是对乔姆斯基短语结构语法的一个重大改进。这是计算语言学对理论语言学作出的又一贡献。,,语言在实际使用时总是以篇章或话语的形式出现的省略和指代以及单词和句子的歧义,,问题一般要在上下文背景之下才能解决而要在字里行间找出说话者的真正目的则需要根据广泛的关于客观世界的知识和其它信息才有可能知其端倪。因此,计算语言学中还出现了一些,、、-关于篇章处理和话语分析的理论和方法如脚本(seript)规划(pla,1)故事语法(storygrama、。、、、mr)故事树(storytree)计算语言学对如何处理省略指代话题照应关系以及篇章结构等等,。,问题也进行了一些有益的探讨这些都推动了语义学的发展并且使语义学与语用学紧密。,arserr地联系起来1983年美国斯坦福大学的巴威斯特(Bwit)和佩利(Py)出版了《情景和态,。Sit:,atiollandAttitudes)一书situationsema:ities)的自然语言模型度》(提出了情景语义学(“”,、、所谓情景就是个体性质关系和时空位置等构成现实世界(非语言环境和场面)的各种状,。,况的集合可以利用这样的情景来描述语言的语义可见情景语义学已经把一般的语义学和,。i剖月学紧密地结合起来对自然语言的研究有重要作用.x9921.·年第期89\n。e,卜情景语义学一提出就引起世人的瞩目斯坦福大学为此成立了语言与信息研究中心(C,,。te:ro:tl、estudy。fLa:飞guag。a:idl:、formatio:1简称CSLI)专门在情景中来研究自然语言、CSLI山17位来自斯坦福大学计算机科学系语言学系和哲学系以及斯坦福国际研究所,。(SRl)的著名的老资格科学家组成阵容十分强大:CSLI当前的任务是¹把自然语言研究扩展到情景的领域。,。º把计算机语言的研究也进一步扩展使之能处理信息的内容和嵌套世界的情景,»在整个科学哲学和数学基本原则的基础上把传统的自然语言和计算机语言的理论融,。合为一个综合的整体使自然语言和计算机语言的研究朝着统一的方向发展情景语义学在言谈分析和理解、上下文处理、照应关系、动词时态、话语焦点、篇章结构的研究方面都取得了可喜的成果。计算语言学还促进了词汇学的发展。词典编纂历来是一件十分枯燥乏味而极为辛苦的工作。计算机使得这件工作变得简单易行、轻松愉快。计算机可以给词典提供足够的例句,免去,了;手工编纂时转抄大量卡片的麻烦计算机可以通过单词频度和使用度的统计确定常用词和,。,,通用词编写出各种语言的基础词表和频率词表近年来还出现了各种形式的电子词典这种,词典中存贮着丰富的语言信息为机器翻译和计算语言学其它部门的研究提供了签本的静态语言信息。日本成立了电子词典研究所,专门研究电子词典的理论和应用问题。现在,在许多,。国家电子词典的编制已经成为了一种产业,。在计算语言学的推动下文字学研究开始同图象识别的方法结合起来因为文字也是一种,,,,图象图象识别中采用的许多方法如图象识别的句法分析方法也可用到文字识别中去这方,,面的工作在美国和日本都取得了很大的成就这也许会给古老的文字学研究开辟出一片新天地。,我国的汉字识别研究独具特色采用选取汉字特征点和数学形态学的方法来提取汉完的,,,。结构特征在印刷体汉字识别方面已经研究出一批实用系统部分系统已经商品化这些系统一般都具有版面分析、文本识别、识别结果后处理、自动纠错、自动编辑、自动输出等功能。在联,,。机手写体汉字识别方面识别率正逐渐提高已达到部分商品化的水平计算语言学还影响到了语言材料的搜集、整理和加工。理论语言学的研究必须以语言事实,、,。作为根据必须详尽地大量地占有材料才有可能在理论上得出比较可靠的结论传统的语言、,、。材料的搜集整理和加工完全是靠手工进行的这是一种枯燥无味费力费时的工作计算机出,,。,现后人们可以把这些工作交给计算机去作大大地减轻了人们的劳动后来在这种工作中逐,。。rt,5ls。S,渐创造了一整套完整的理论和方法形成了语料库语言学(pligtliti)并成为了计算语言学的一个分支学科。语料库语言学主要研究机器可读自然语言文本的采集、存储、检索、统、、,以、、计语法标注句法语义分析及具有上述功能的语料库在语言定量分析词典编纂作品风、。现,,格分析自然语言理解和机器翻译等领域中的应用在美国建立了布朗语料库英国和挪威联合建立了。,LOB语料库欧美各国学者利用这两个语料库开展了大规模的研究其中最引人。注目的是对语料库进行语法标注的研究他们设计了自动标注系统TAGGIT来给布朗语料库,。的100万词的语料作自动标注正确率为70%他们还设计了CLAWS系统来给LOB语料库,,,作自动标注根据统计信息来建立算法自动标注正确率达96%比基于规则的TAGGIT系。,统提高了将近20%最近他们同时考察三个相邻标记的同现频率使自动语法标注的正确率,90.语言文字应用\n达到”.5写。这个指标。已经超过了人工标注所能达到的最高正确率,,e计算语言学不仅影响了传统理论语言学的上述部门而且还强烈地冲击着索绪尔(D,,sure)以来的普通语言SaLls学基本理论以大量的新的事实和研究成果严峻地考验着这些基本理论。我们这里只是谈一谈关于语言符号的特性的问题。索绪尔在他的《普通语言学教程》一书,:中曾提出语言符号具有如下两个重要的特性一、符号的任意性。语言符号的能指和所指联系是任意的,索绪尔认为,符号任意性的原则“,,,支配着整个语言学它的后果是不胜枚举的人们经过许多周折才发现它们同时也发现了这个”。原则是头等重要的〔1〕二、。,,只在,能指的线条性索绪尔指出语言的能指属于听觉的性质时间上展开而且具有:,,。借自l讨问的特征(l)它体现为一个长度(2)这长度只能在一个向度上测定它是一条直线索“,,绪尔认为这是一个似乎为常人所忽视的墓本原则它的后果是数之不尽的它的重要性与符,”。号任意性的规律不相上下语言的整个机构都取决于它〔1〕,。,索绪尔提出的语言符号的这两个特性当然是十分重要的然而索绪尔以后现代语言学,,。的发展特别是电子计算机出现以后计算语言学的发展严峻地考验着索绪尔的理论,,,在我们看来索绪尔提出的语言符号的任意性这一特征是无可非议的但是他提出的语。,言符号的第二个特征能指的线条性就未必是正确的了因为新的研究结果表明语言的能指并不只是线条性的—东西。英国著名语言学家弗斯(J.K.Fi:tl)提出“跨音段论”(I,rosodic),他‘,,,区别性语音特征不能都归纳在一个音段位置上,订为在一种语言里例如语调就不是处于一,,。个音段位置上而是处于前后相续的线条性的音段之外笼罩着或管领着整个句子的东西如,,果我们把语调这样的跨音段成分算进去语言的能指就不宜看作是线条性的东西而应该看作是立体性的东西了。,,索绪尔是一个出色的天才的语言学家他是名副其实的现代语言学的奠基人他的语言学,,。说是语言学史上哥白尼式的革命对于现代语言学的发展有着深远的影响现代语言学的每,,。一个领域每一个流派都直接或间接地受到了索绪尔语言学说的影响他所说的语言符号的上,.,述两个特性是在当时的语言学和白然科学发展的水平下提出来的在索绪尔的时代还没,,、、有电子计算机计算语言学这样的新兴学科还远远没有形成语言学主要是与语言教学文学历史、考古学等学科有联系。在这种情况下,索绪尔当然不可能提出那些只有在电子计算机时代才能揭示出来的语言符号的新特点。,,随着电子计算机的出现和发展特别在计算语言学出现之后普通语言学的理论也应该相应地发展。我们不能墨守成规,满足于旧有的结论,而应该站在前辈学者的双肩上,高瞻远瞩,,,,吸取计算语言学的新成果从新的角度用新眼光以新的方法来研究语言这一个极为复杂的符号系统。正是基于这样的认识,我们觉得,语言符号除了索绪尔所指出的那两个不尽完善的,。特点之外还有着如下7个十分引人注目的特点,第一语言符号的层次性“”,,。弗斯的跨音段论己证明语言符号并不是线条性的东西而是立体性的东西所谓立体,,,。性就是说语言符号具有分层结构即层次性,。语言符号的层次性在句子结构方面表现得特别明显,“Toldmclandwomonstayat美国描写语言学派的语言学家早就指出英语的lecd1··992年第1期91\noe”。,hm(年老的男人和女人留在家里)这句话是有歧义的如果我们把这一句话说给一些人听“”,很可能有的听话人会认为它的意思是年老的男人和所有的女人(不论年龄大小)留在家里“”,另一些听话人会认为它的意思是所有年老的男人和所有年老的女人留在家里还有的听话,。人干脆不能作出决定处于模棱两可的状态,‘o”。事实上,otdmelaldwm。这个名词短语根据意义的不同有两种不同的层次结构如,,。果注意到层次的不同那么这种意义上两可的情况就可以得到解释一种层次结构是oena且oenldmdwmt一-~~-一-J名~-一-一一一一一口,:“”。这时这个名词短语的意义是年老的男人和所有的女人另一种层次结构是oel飞anoenldmdwm,:“”。这时这个名词短语的意义是所有年老的男人和所有年老的女人,。,在计算语言学中常采用树形图来表示语言符号的层次关系计算语言学认为任何一个,。句子的线性序列的表层之下都隐藏着一个层次分明的树形图当一个句子的线性序列之下隐,,。藏着一个或两个以上的树形图时这个句子就会产生歧义就会得到不同的解释。,:一树形图山结点和连接结点的枝组成树形图的各个结点之间有两种关系值得注意种,,,是支配关系它反映了上下结点之间的先辈和后裔的关系一种是前于关系它反映了左右结点之间前位和后位的关系。语言符号的线条性尸反映了前于关系,而没有反映支配关系,当然就有很大的局限。树形图与计算语言学中广为应用的短语结构语法有着明显的对应关系。乔姆斯荃的短语,,。结构语法既能描述自然语言也能描述程序设计语言短语结构语法可定义为一个四元组G,,,,,,,,一(VNVTSP)其中VN是范畴符号的集合VT是单词符号的集合S是初始符号P是。PA、。,A是,。。重写规则的规则形式为VN中的单个符号是非空的符号串如果有某个树形图满足下列条件,它就是短语结构语法:G的推导树,u¹每一个结点有一个标记这个标记是VNNT中的符号:º根的标记是S,,一n,;»如果结点至少有一个异于其本身的后裔并有标记A那么A必定是VN中的符号,,,,,,,,¹如果结点n1nZ⋯nk是结点n的直接后裔从左到右排列其标记分别为AlAZ⋯,,。Ak那么A~AIA2.二Ak必定是p中的重写规则,计算语言学建立的短语结构语法与树形图之问的这种联系正是基于对语言符号层次性。短,的认识的荃础之上的语结构语法和树形图被广泛地使用于计算语言学中儿乎每一个计算,。语言学研究者天天都要与短语结构语法和树形图打交道天天都要研究语言符号的层次关系,,,计算语言学的发展进一步加深了我们对于语言符号的层次性的认识语言符号的层次性确实是一个比索绪尔提出的语言符号的线条性更为深刻的特性。,第二语言符号的非单元性,丛于对语言符号的层次性认识的荃础之上的短语结构语法在机器翻译和自然语言理解的研究中很快就暴露出了它的不少缺陷。这种语法分析能力不高,分析时难于处理歧义等自然’,92.语言文字应用\n,,;,语言中普遍存在的问题常常捉襟见肘进退维谷这种语法生成能力过强往往会生成许多歧,,。,,义的句子或不合语法的句子使人误入迷津扑朔迷离后来计算语言学研究者发现引起这,,它把语言符号看成是不可些缺陷的症结在于短语结构语法是采用单标记来描述语言符号的。,分割的原子式的单元如果把语言符号看成是可以分割的非单元性的东西采用多标记函数或,,者复杂特征来描述便可以从根本上克服短语结构语法的上述缺陷大大地改善短语结构语法,,。,的功能提高它过弱的分析能力限制它过强的生成能力这样便提出了语言符号的非单元性问题。其实,早在1936年,美国语言学家雅可布逊(R.Jak。匕son)在比利时根特城举行的第三届,、。,国际语音学会议上就提出了能否以对分法为基础来分解元音辅音等音位的问题1951年他在与范特(M.fQnt)、哈勒(M.日。日e)等语音学家合写的论文《语音分析初探》中,提出了对分法理论以及区别特征学说。,一切的音,他们认为(无论元音或是辅音)都是可分的可以根据它,“”numars。,们的生理的或声学的特性用对分法分成一对一对的最小对立体(miimpi)例如元“”,“”。音的舌位有高一低的对立辅音的发音方法有清一浊的对立他们把这些最小对立体归itjfeatures),,结为十二对区别特征(djslncve并且指出世界上各种语言都可以用这十二对区。,、别特征加以描述这样过去一直被认为是不可分的单元性的元音辅音就变成由若干区别特征组合而成的、非单元性的结构体了。这种区别特征理论已成为现代语音学进行音位分析的基础。任何一个音位都可以用区别特征的集合来加以描述。如某一个音位具有二项对立中的前,“”,,“”,,项特征记以正号+具有二项对立中的后项特征记以负号一就可以作成一个矩阵表作为对每一个音位的区别特征集合的描述。这种音位理论,已经在语音自动识别和合成的研究,。。中得到应用证明是行之有效的这是语言符号非单元性的有力证明,。为了计算语言学的理论和实践加深了我们对于语言符号的非单元性的认识改进乔姆斯,,“”,“基的短语结构语法在计算语言学的许多理论中都自觉地采用的复杂特征的概念使用特”。征/值系统来描述句子的结构“”“”,计算语言学还提出了非单元性的这种复杂特征进行运算的数学方法合一运算—。从而使我们对于语言符号非单元性的认识可以在计算机上进行实际的操作和演算这种合一,。,运算并不完全服从于传统的集合论的运算集合运算一般并不考虑运算对象的相容性而合一运算则必须考虑运算对象。:的相容性合一运算具有两种作用,,“”。¹合并原有的特征信息构造新的特征结构这与集合论中的求并运算类似,,º检查特征的相容性和规则执行的前提条件如果参与合一的特征相冲突就立即宣布合一失败。,,。可见合一运算提供了一种在合并各方面来的特征信息的同时检验限制条件的机制这正是非单元性的语言符号在计算机运算时所需要的。所以,计算语言学不仅在理论上证明了语,。言确实具有非单元性而且还在实践上使这种非单元性获得了计算机上进行运算的可能性,第三语言符号的离散性,,我们平时说话时的语流似乎是连续不断的但在实际上这些连续不断的语流却是由许多,,,离散的单元所组成的(当然这些单元本身又是一个复杂项可以由若干个复杂特征组成具有,,,。非单元性但就每个单元对其它单元的关系来说它们又是彼此独立的具有离散性)在水平,,,方向上语流可以被分解为若干段落一个段落又可以被分解为若干句子一个句子又可以被,,,分解为若干短语一个短语又可被分解为若干单词一个单词又可被分解为若干普素一个语1992年第1期·93·\n,。素又可被分解为若干音节一个音节又是由若干个元音和辅音音位组合而成的在竖直方向,,。,上语流中的各个成分又引起联想引出与之属于同一类聚的若干个离散单元来所以在连续,。语流的水平方向和竖直方向上实际上都是与若干个不同的离散单元联系着的,,语言符号的这种离散性在语流的停延时表现得特别明显人们往往可以利用语流停延的,。这种离散性质来区别语流的不同含义,,,汉语的书面语在词与词之间是连写的不象印欧语的书面语那样留有空白因此在汉语,。,书面语中词与词之间的离散特点体现不出来这种情况给汉语的自动句法语义分析造成了极大的困难。在中文信息处理中,汉语自动句法语义分析的第一步便是自动切词,根据词与词,。,,之间的离散特征把相互连在一起的词切开可以说语言符号的离散性是汉语自动切词在语。言学上的理论根据..。:“美国语言学家朱斯(MJoos)早就指出了语言符号的这种离散性他说数学研究工具一:,,,般具有两种类型连续分析(例如无限小量的计算)或离散分析(例如有限群理论)而可以称,,,,为语言学的那个部门则属于后者这时它不容许与连续性有半点儿妥协因此凡是与连续性,。”“有关的一切都得排除于语言学之外朱斯十分明确地把语言看成是不可分解的语言学原子”,,。:“或范畴离散地结合起来的据此他提出用离散数学来研究语言他说物理学家利用连续数,、,,学来解释言语如傅利叶分解自相关函数等而语言学家则与此相反他们利用离散数学来研。”究语言〔2〕朱斯关于语言符号离散性的论述似乎有点儿矫枉过正。语言符号当然具有离散性的一面,,,。,但是语言符号也有连续性的一面特别是在语言的使用中在语言的交际过程中我们也可以,。利用一些连续数学的方法来研究它而且实际上在这方面我们已经取得了不小的成绩朱斯要“”,“”,。,“把凡是与连续性有关的一切都得排除于语言学之外确实是太过分了事实上离散”“’,,,,性和连续性都是语言符号本身所具有的性质不过在语言的使用的交际过程中我们强调,,,语言符号的连续性用连续数学的方法来研究它在语言结构的分析中我们强调语言符号的,,。离散性用离散数学的方法来研究它而语言本身则是离散性和连续性的统一体,,根据语言符号的离散性计算语言学中采用集合论的方法建立了自然语言的集合论模型,。,并把这样的模型应用于机器翻译中获得了很好的效果这意味着语言符号的离请沙隆这一特性,在自然语言i一}·算机处理的实践中已经得到了证实。,第四语言符号的递归性,而语法规则却是有限的,人们之所以能够借助于有限的语法规语言的句子是无穷无尽的,,。则造出无穷无尽的句子来其原因就在于语言符号具有递归性,。语言符号的这种递归性在不同的语言里表现不尽相同汉语的句法构造的递归性突出地表现为。,句法成分所特有的套叠现象在汉语里由实词和实词性词语组合而成的任何一种类型,,,。的句法结构其组成成分本身又可以山该类型的句法成分充任而无须任何的形态标志这种套叠现象在主谓结构、偏正结构、述宾结构、述补结构、联合结构、复谓结构中都是存在的。这是山语言符号的递归性导致的汉语语法的一个重要特点。,。,在计算语言学的研究中语言符号的递归性起着很大的作用机器翻译的实质就是把源,,。语言中无限数目的句子通过有限的规则自动地转换为目标语言中无限数目的句子如果机,,器翻译的规则系统不充分利用语言符号的递归性要实现这样的转换是非常困难的甚至是不可能的。语言文字应用\n乔姆斯基指出,早在19世纪初,德国杰出的语言学家和人文学者洪堡德(W.V.“”。,日umboldt)就观察到语言是有限手段的无限运用但是由于当时尚未找到能揭示这种理解,。,所含的本质内容的技术工具和方法洪堡德的论断还是不成熟的那么究竟应该如何来理解“”呢:“语言是有限手段的无限运用?乔姆斯基指出一个人的语言知识是以某种方式体现在人,。脑这个有限的机体之中的因此语言知识就是一个山某种规则和原则构成的有限系统但是一个会说话的人却能讲出理解他从来未听到过的句子及和我们所听到的不十分相似的句子。而,。,且这种能力是无限的如果不受时问和注意力的限制那么山一个人所获得的知识系统规定了特定形式、结构和意义的句子的数口也将会是无限的。不难看到这种能力在正常的人类生活中得到自山的运用。我们在日常生活中所使用和理解的句子范ha是极大的,无论就其实际情况而言还是为了理论上描写的需要,我们有理山认为人们使用和理解的句子的范围都是无限。”3〕的〔,那么怎样来刻画语言这个无限集的成分组成情况呢?,。,我们可以把语言中所有的元素列成一个表进行简单枚举例如,,,,,L~{中oboaob⋯),,,这样的刻画办法把后面一大部分东西省略掉了后面未列出的部分只好由我们根据给,。“”出的少量的元素去想象这样的刻画办法显然是不好的它不能体现有限手段的无限运用这一原则。,。我们应该采用递归的方法来刻画语言为此提出如下的公理系统的定义,,,,,一个公理系统是一个有序三元组(ASp)其中A是符号的有限集叫做字母表;S是A,,上的符号串的集合叫做公理;p是在山A中的符号组成的符号串上的n位关系的集合n)2,。,(即p中n元组至少必须是有序对)p的元叫做生成式或推理规则根据这样的公理系统我,,、们便可以从公理S出发多次使用推理规则p在符号集A上递归地生成各式各样的无限的,“”。。符号串实现有限手段的无限运用因而这个关于公理系统的定义是体现了递归的原则的如果我们把公理系统中的A想象成前而所述的短语结构语法中的非终极符号VN和终极符号V丁的集合,把S想象成短语结构语法中的初始符一号,尸想S把象成短语结构语法中的重,,,。写规则p那么我们马上就可以发现短语结语构法与公理系统是十分相似的所以我们可以,。说短语结构语法是采用体现了递归原理的公理化方法来描述自然语言的语法,,现在计算语言学业已严格证明乔姆斯荃的形式语法实际上等价于数学上的一种公理系,统半图厄系统(se而一丁huesystem)这种形式语法不过是数学中的公理系统理论在自—,然语言分析中的应用而已语言的生成过程完全可以通过公理系统这一形式化的手段得到严。,‘,正因为如此,又在计算格的描述乔姆斯基的形式语言理论才会既在自然语言的信息处理中一·,机程序语言的设i】中得到如此广泛的应用。,,,。所以我们认为语言符号的递归性是反映了语言符号本质的又一个特点的计算语言学,。深化了我们对语言符号的递归性的认识普通语言学的理论对此应该给以足够的重视,第五语言符号的随机性,、(longoge)(porol索绪尔在《普通语言学教程》中把语言现象分为言语活动言语e)和语,。言(!。ngue)三样东西它们之间是彼此联系而又相互区别的,“、,、,他指出言语活动是多方面的性质复杂的同时跨着物理生理和心理几个领域它还属于个人的领域和社会的领域。我们没法把它归入任何一个人文事实的范畴,因为不知道怎样去1·.992年第1期95\n。”,“:一部分,理出它的统一体因此言语活动的研究就包含两部分是主要的它以实质上是社会、,;,的不依赖于个人的语言为研究对象这种研究纯粹是心理的另一部分是次要的它以言语活,,,,·。”“,动的个人部分即言语其中包括发音为研究对象它是心理物理的把语言和言语分开,;(2),我们一下子就把(1)什么是社会的什么是个人的什么是主要的什么是从属的和多少是。”偶然的分开来了,,在索绪尔关于语言和言语区分的理论的影响下乔姆斯基提出必须把说具体语言的人对,这种语言的内在知识和他具体使用语言的行为区别开来并把前者叫做语言能力eoetenee,eroranee。,,(mp)后者叫做语言运用(pfm)我们认为乔姆斯基的语言能力大体上相,,。当于索绪尔的语言乔姆斯基的语言运用大体上相当于索绪尔的言语,,在言语(或语言运用)中当我们用语言来进行交际活动的时候有的语言成分使用得多一,,,,些有的语言成分使用得少一些各个语言成分的使用并不是完全确定的这种不确定性就是。,这些,语言符号的随机性我们在学习语言时经常感到语言规则中总是有许多的例外例外就。,,。是由于语言符号的随机性造成的所以语言符号的随机性也应该是语言的本质属性之一,。正因为语言符号具有随机性所以我们很难用确定性的规则来描述它语言使用中大量的,,,例外现象使研究语法的语法学家们伤透脑筋有的语法学家甚至因此而误入迷津以偏概全得出了。,“,错误的结论为了避免以偏概全的错误我国前辈语言学者曾提出例不过十不立反例”,不过十不破的原则来制定语法规则这个原则常常作为判断语言学家治学态度是否严谨的准绳。其实,对于言语活动这样的随机现象来说,找出十个例子来立某条语法规则并不难,而找出,以十个例子或十个反例来作为某条语法规则破或立的十个反例来破某条语法规则也很容易,。标准看来未必恰当最好的办法还是采用统计数学的方法来对交际活动中所出现的各种语言现。,象进行描述如果我们从语言学理论的高度把随机性看成是语言符号本身的一种自然特,,性并采用恰当的数学工具来描述这种随机性使用计算机来进行一般手工操作所难于胜任的,,,大量的统计计算和分析那么我们对于语法规则中的各种各样的例外情况也就不会再感到,。迷惑和束手无策了因为这些例外情况正是由于语言符号本身的随机性这一特点而形成的,,从计算语言学的角度看来在语言成分的出现这一个随机事件中随机事件A与条件组S,,。之间虽然没有完全确定的联系但是它们之间却有着统计上的联系尽管当条件组S实现一,,。,,次时事件A可能发生也可能不发生但是如果条件组S实现多次事件A的发生就有着某,。,,种规律性这种规律性就是统计规律性计算语言学认为那些无一例外的必然的规律性只不过是这种统计规律性的补充和表现形式罢了。,,近年来不少的语言学家开始认识到语言符号的这种随机性自觉地使用统计方法来描述,。,,自然语言现象这是令人可喜的在计算语言学中根据语言符号的随机性已经在计算机上作了,。、、、很多统计工作成果累累我国学者进行的汉字字频统计汉字部件统计汉字笔画统计书、、、、面语词频统计汉字嫡值计算汉字冗余度计算汉语语音统计汉语方言亲疏关系的分析和统,,。计为汉语的计算语言学研究提供了可靠的统计结果推进了我国计算语言学的发展这些事,,。实说明一旦我们在理论上自觉地认识到语言符号的随机性就会产生出巨大的物质力量语。,言学的理论对于语言研究的实践确实有着重要的指导意义语料库语言学的研究可以帮助我,,们从大量的经过标注的语言素材中发现语言的统计规律并把这些规律提炼为计算语言学的规则。这种研究生动地体现了索绪尔所指出语言和言语的相互关系。大量的语言素材相当于,,,索绪尔定义的言语语言学规则相当索绪尔定义的语言通过对言语的统计研究就可以发现·96·语言文字应用\n语言的规律。这是语言符号随机性的又一佐证。,第六语言符号的冗余性,语言成分在交际活动中的出现是一个随机事件语言成分之问彼此有着相互的影响和制,,,,约也就是说前后的语言符号具有相关性我们根据前面出现的符号常常可以预测后面的符号出现的可能性。当说话不清楚或文字有错落时,我们往往可以根据前后文来理解话语或文章。,的含义就是当某个汉字或拉丁字母不清楚时我们根据它们的残存部分常常就可以推断文字。,的全形在有噪声或干扰时我们仍然有能力根据已经听清楚的部分来识别那些不清晰的语二忆。曰,这些事实说明并不是语言中的一切成分对于传达语言符号整体所包含的信息都是绝对,,。不可缺少的就是缺少了某些部分语言本身有能力把这些缺少的部分补充和恢复出来这意,。,味着语言符号具有冗余性这种冗余性是必要的和有益的它保证了不理想的环境下(如书面,,,,。文章中有遗漏谈话时有嘈杂声书写的字母不清楚发音不清晰)仍能发挥其交际功能因,“”,,此我们不能认为冗余度就真的是语言中冗余的或不必要的东西恰恰相反这种冗余度是语言传递信息时必不可少的。没有冗余度的语言在实际上是无法理解的,因为日常语言总有很,大的灵活性要想理解句子的意思就必须考虑到字母在单词中的位置和单词在句子中的上下。“”“”,这。,文关系我国著名语言学家李荣教授建议把冗余度改为羡余度是很有道理的事实上只要语言有结构性就会有冗余度,语言符号的冗余度就是语言的结构性在语言使用过程中的体现。这样看来,语言符号的冗余性也应该是语言符号的一个重要特性,它与语言符号的随机,。性一样无时无刻不在语言的使用中表现出来,第七语言符号的模糊性‘索绪尔完全没有认识到语言符号具有模糊性。索绪尔认为,正是山于语言的作用,才使模糊的思想和声音的各个单位之问清晰起来。在索绪尔看来,语言本身是谈不上模糊性的。,,。关于语言的模糊性问题在计算语言学出现之前就有不少学者进行过探索和研究著名.。1923,哲学家罗素(BRussel)于年写过一篇《论模糊性》的论文1933年美国语言学家布龙非,。尔德(B!。。mfield)在《语言论》一书中也指出了自然语言中存在着模糊现象,、、、、、、山此可见层次性非单元性离散性递归性随机性冗余性模糊性等7个特性也是语言符号十分重要的特性。索绪尔提出的语言符号的线条性可以用更为深刻的层次性代替,而他“”、“”。因此,,提出的语言符号的任意性确实是头等重要的支配着整个语言学的原则我们认为,,,、语言符号的特性除了上述的7个特性之外还应该加上任意性这样语言符号就具有任意性、、、、、、。,层次性非单元性离散性递归性随机性冗余性模糊性等共8个特性计算语言学的发展使我们对于语言符号的这些特性的认识和理解更为丰富、更为深刻了。在这种情况下,我们不,。得不修正索绪尔的旧理论而代之以反映当前人类对自然语言符号认识水平的新理论这是计算语言学在普通语言学的墓本理论方面对理论语言学提出的挑战。参考文献,,。:亥》〔幻索绪尔普通语言学教程中译本商务印书馆〔2〕F.Harady,H·PaPer,TowardSageneralCalCUlusofPhonemiCdlstribUtion,查看更多