Jan .,2003第32卷第1期 Journal of Shanghai Teachers University(Philosophy &Social Sciences)Vol.32,No.1
中图分类号:H14 文献标识码:A 文章编号:1004 8634(2003)01 0051 (07)
无论 类连词在句法分析中的标记功能
!!!面向信息处理的现代汉语语法研究
由丽萍1
厉霁隽
2
(上海师范大学人文学院,上海200234)
摘 要: 目前可供信息处理用的语言知识还很不够,而现代汉语的句法单位类型和句法
功能、语义关系的对应情况又比较复杂,针对这一情况,文章提出了由格式标记驱动的自然语言分析方法,并以 无论 类连词为例,做了具体分析。文章对 无论 类连词的句法分布情况做了比较细致的描述,在此基础上得出了一系列标记性框架,并制定了自动分析规则。 关键词: 自然语言处理;中文信息处理;标记功能;连词
此文为上海市重点学科项目成果。收稿日期:2002 12 05
作者简介:1 由丽萍(1979 ),女,山东青岛人,上海师范大学人文学院硕士研究生。
2 厉霁隽(1978-),女,上海人,上海师范大学人文学院硕士研究生。
从信息处理的角度出发,我们需要机器可读的准确、完整、系统的语言知识库。计算机处理自然语言能力的高低很大程度上取决于系统配备的语言知识库的质量。很多语言现象对于人来说没有歧义,但计算机处理时却有可能发生错误,原因就在于人的语言理解运用了人脑知识库中贮存的许多背景知识,而迄今为止可供计算机使用的语言知识还很不够。
目前计算机处理语言信息时,采用的办法多是对各个词或短语的句法、语义特征进行孤立的描述,然后依据一定的规则进行运算。但由于现代汉语的句法单位类型和句法功能、语义关系的对应情况比较复杂,计算机的自动句法分析和语义理解还有很多困难。例如对这样一个句子做句法分析∀:
[这栋楼房]np 1,无论[周围环境、内部装修]np 2,还是[它的价格]np 3,[都很适合你们新婚夫妇]vp 。
这个句子由三个名词性短语和一个动词性短语组成。抽象地分析,由三个名词性短语和一个动词性短语组成的句子至少有六种可能的切分结果:
(1)np 1[np 2[np 3 vp ]](2)np 1[[np 2 np 3]vp ](3)[np 1 np 2][np 3 vp ](4)[np 1 np 2 np 3]vp (5)[np 1[np 2 np 3]]vp (6)[[np 1 np 2]np 3]vp
这样就会导致多种句法关系标注结果:(1)可能分析成三层套叠的主谓谓语句(这样的句子如 [这衣服]np 1[你]np 2[扣子]np 3[还没钉]vp 呢。 );(2)也是主谓谓语句,但小主语是两个np
51
(4)是三个np并列,再和vp构成主谓句([鸦片战争]np1、[辛亥]np2和[五四运动]np3,[都是中国近代史上的重大事件]vp。);(5)是动词谓语句,np2与np3先构成并列短语,再和np1并列(如 [张华]np1和[爸爸]np2[妈妈]np3[都不在家]vp。);(6)也是动词谓语句,但主语是np1与np2先结合,再和np3构成并列式名词性短语(如 [身体素质]np1和[心理素质]np2甚至[智力水平]np3,[都是可以训练的]vp。)。
进行机器标注,一个很大的任务就是排除分析歧解。在对句法分析结果进行校对的过程中我们注意到,有些词有很强的标记作用,它们与其他词或标点配合起来可以形成一定的格式框架。充分利用这些标记,往往可以消除一些分析上的歧义,这就是由标记词驱动的自然语言分析方法。具体地分析以上提出的例句,我们可以看出,以上的六种分析结果并不都具有现实性,因为句子里有三个标记词: 无论、 还是和 都。有了 还是,就把np2和np3的关系确定下来了,它们是选择性并列短语,有了 无论和 都就把(np2+ np3)和vp组合起来了,它们是主谓结构;而np1的句首位置又是话题性标记,应分析成主语,所以,只有(2)的分析具有现实性。可见,在信息处理中,建立一个由一些标记性词语构成的句子格式的系统是非常必要的,通过标志性词语及其形成的框架可以确定句法层次、句法关系甚至句法功能和语义关系。这个规则系统是在经过初步的短语加工的基础上起作用的,当计算机切分并标注了下位层次的短语,尚无法确定上位层次的切分和标注时,运用这一规则系统,可以做出正确的处理,上面例句的处理就是利用 无论∃∃还是∃∃的框架来确定np2、np3和vp的句法层次和句法关系的;当计算机已经完成标记词所在层次的处理时,运用由标记词驱动的分析规则,可以检验标注的结果,确认或否认之前的分析。可见,这一规则系统的运用既是形成新的分析结果的过程又是检验已有分析的过程。本文就以 无论类连词为例,对面向信息处理的由标记词驱动的语法分析规则的研究做一个初步的尝试。
本文所说的 无论类连词包括 无论、不论、不管等表示 无条件的条件关系的连词。 无论类连词连接 无条件的条件和结论,利用它们构成的框架可以切分出表示条件的句法单位和表示结论的语法单位两部分,这两部分有可能是两个分句或分句的组合,也有可能是单句中的两个不同的句法成分。我们在进行处理时,将 无论类连词与条件部分组合在一起,构成一个更大的句法单位,其句法类型由条件部分决定,如: [无论[道德的观念如何变化]zw]zw,[却从没有把说谎当作道德的信条的]vp。
这样可以大大方便后面的层次处理以及将来的逻辑、语义关系的自动理解和句子的自动生成。根据不同的语料加工系统,可以有不同的处理策略,但这不影响对本文提出的语法分析规则的使用。本文的具体思路是:首先对 无论类连词的句法分布情况做比较细致的描述,在此基础上得出标记性框架,制定切分和功能标注规则。
一、处理 无论类连词的一个很大的难点在于它对前面步骤的分析结果(尤其是词语切分和词性标注)有很强的依赖性,一旦前面有错误, 无论类连词的正确处理就很难保证。目前看来,问题主要集中在字符串 还是和 无论是/不论是/不管是上。下面是一个经过机器自动切分和标注的句子, 还是标注成了动词:
[fj[vp[vp无论c[vp是v[pp在p[np[np群众性n的u[np[np[np身体n锻炼vN]活动n]方面n]],[np[np学校n体育n]方面n]]]]],[vp 还是v[np[vp[pp以p[vp提高v[np[np运动n 技术n]水平n]]]为主v]的u[np[np竞技vN运动n]方面n]]]],[vp都d[vp有v[np长足a的u进展n]]]]。
我们把本句排列成树结构(见图),可以看得更清楚一些,考虑本文论述的必要和篇幅的,这里没有分析到最底层:
这段语料在词处理阶段将 还是标注成动词,这样自然和后面的np 以提高运动技术水平为主的竞技运动方面构成v p,vp本身构成单句或分句的能力就比较强,况且作为vp,不具备与前面的np 群众性的身体锻炼活动方面和 学校
52
第1期 上海师范大学学报(哲学社会科学版) 2003年
体育方面 构成并列短语的条件,所以不能与它们共同做介词 在 的宾语,这样pp 的右边界就落在了 还是 之前,这是错误的开端。又因为逗号是比较强的短语分界标记,所以pp 与前面的动词 是 构成vp,而不是与后面的vp 结合。这样句子在形式上就简化成了 无论vp,vp,vp ,由于第一个vp 紧接 无论 ,而和后面的vp 之间又被逗号隔开,也就是说它和 无论 结合的紧密度要高
一些,所以,切分成: [无论vp ],vp,vp ;又因为第二个v p 与前面的短语的相似度大一些(形式上都是 v ∃∃方面 ,语义上都与运动有关),所以,和前面结合成更大的v p,最终形成这样的切分结果: [[无论vp ],vp ],vp 。这样,就打乱了结构层次,语义上也打乱了 无条件的条件 和结论之间的关系。可见,词语切分和词性标注结果对短
语处理以及以后的句处理的影响是非常大的。
还是 作连词,表示在几项中选择一项,根据对真实文本的考察,在114个 还是 出现在 无论 类连词后面的句子中, 还是 作连词的有95句,自然语言处理应该将重点放在占多数的语言现象上,而不是个别例外,所以我们主张机器处理中出现 还是 时,若前有 无论 类连词,则优先处理成连词。自然语言处理中各个规则是互相制约的,即使对于那些例外,句中也往往有其他条件,可以否定 还是 的连词性质,确保处理的准确性。如:
无论有多少闪光的斑点,入眼总还是提不起精神。
还是 出现在副词 总 后面,这就否定了它的并列连词性质。在 无论 句中, 还是 作副词时也有标记作用,详见本文第三部分。
对于 无论是/不论是/不管是 ,有的系统处理成一个词,有的则将 无论/不论/不管 和 是 切分开,分别标注为连词和动词。前者虽然照顾到 无论是/不论是/不管是 的使用频率比较高这
一特点,但是容易形成 多义型歧义字段 %。例如以下两例就应该切分开:
那七天我的确是想不起干嘛了,但有一条我可以肯定,我没去过云南,从来没去过,不管是不是那七天。( 是 与 不是 构成并列短语)
爱情无论是橄榄还是黄莲,得先自己一个人嚼一嚼。( 是 作 爱情 的谓语中心语)
我们主张将 无论/不论/不管 和 是 切分开,这不只是为了操作的方便,也是尊重语言事实,当 无论是/不论是/不管是 后面列举几项表示无条件的条件时,可以将并列项扩展成 无论是/不论是/不管是&是&是&∃∃ 的格式,例如在真实文本中可以见到这样的句子:
不管是大褂是棉裤是棉鞋都过长过大。
如果第一个 是 是 不管是 的构词语素,那么,第二、第三个 是 就无法分析。可见,尽管 无论是/不论是/不管是 的使用频率比较高,但还不是一个词。当然,在不同的处理系统中,如果能消解 无论是/不论是/不管是 的多义型歧义,并能避
53
由丽萍 厉霁隽: 无论 类连词在句法分析中的标记功能
二、 无论类连词在句子里表示在任何条件下结果或结论都不会改变,由 无论类连词统领的部分,称为无条件的条件,它有比较明显的形式标记。
1 用选择性并列成分列举出几种可能出现的条件:
(1)成分与成分之间用 还是连接,构成框架!!! 无论/不论/不管∃∃还是∃∃,根据被连接成分的句法性质分为:
zw:无论[他给她借书]zw,还是[她给他还书]zw,两个人不约而同地都是悄悄进行的。
v p/v:在他今后一生中,不论[生活在农村] v p,还是[生活在城市]vp,他也许将永远会是这样一种混合型的精神气质。
ap/a:是的,什么也别想阻止爱,不管这爱给人带来的是幸福a还是不幸a。
np/n:无论[大事]np还是[小事]np,大家都愿意找他商量。
pp:当然,不论[在他面前]pp,还是[在众人面前]pp,他现在已经不回避他和郝红梅的相好关系。
fp: 中国电信无论在[服务数量上]fp还是[质量上]fp的的确确有了很大的进步,这是有目共睹的事实!
最后一例有两种可能的分析,一种是认为 还是后面省略介词 在, 质量上成为零形式介词短语,这样 在服务数量上还是质量上就成了两个pp并列;另一种处理是 介词+(fp+fp),即介词和并列式方位短语构成pp。我们采用后一种分析方式,使分析结果和语段的实际构成更加一致。
(2)成分与成分之间用 或、或者连接,构成 无论/不论/不管∃∃或(者)∃∃格式:
zw:方家每来个亲戚,偶而说起没看见过大奶奶,他们夫妇就立刻打电话招柔酃去,不论[下午六点钟她刚从办公室回家]zw,或者[星期六她要出去玩儿]zw,或者[星期天她要到姑母家或她娘家去]zw。
v p/v:手机无论[打进]vp或[打出]vp都得付高昂的费用。
ap/a:无论好a或坏a的评价,你必须相信,∃∃
np/n:无论初装费n或是月租费n,都并非任何一个部门或地方电信部门有权制订的收费标准。
pp:不论[在公众场合]pp或是[在自己家里]pp,只要他处于非常失意或非常得意的状态,我便会在他身边喊一声: 停!
fp:无论在[理论上]fp或者[实际工作中]fp, 四人帮都设置了不少禁锢人们思想的 禁区。
(3)成分与成分之间用顿号 、连接,构成 无论/不论/不管∃∃、∃∃:格式
zw:无论[甲方败诉]zw、[乙方败诉]zw,他都会举杯庆祝。
v p/v:她无论走路v、吃饭v、工作v,面前总是站着个孙平。
ap/a:无论好a、坏a,都与我无关。
np/n:垄断能使其无论在何种[经济形势] np、[市场状况]np之下均能凌驾于一般企业之上,何乐而不为?
pp:这条意见,无论[对你]pp、[对我]pp,都是很重要的。
fp:事实上,今天无论在[军事上]fp、[政治上]fp、[经济上]fp,都要超过他们几倍甚至几十倍。
(4)成分与成分之间用逗号 ,连接,构成 无论/不论/不管∃∃,∃∃格式:
zw:不管[东西好坏]zw,[人好坏]zw,没了它们,心便没有地方安放。
v p/v:苟有阻碍这前途者,无论[是古是今] vp,[是人是鬼]vp,[是∋三坟(∋五典(]vp,全都踏倒他。
ap/a:只要性情温柔,没人会不喜欢,不管她好看a,难看a。
np/n:每一个企业都必须为国家、社会创造经济效益和社会效益,无论[国有企业]np,[私营企业]np。
pp:他无论[在体格上]pp,[在精神上]pp ,[在受教育方面]pp,都不能受到委屈和挫伤。
fp:韦翰先生无论在[人品上]fp,[相貌上]fp,[风度上]fp,[地位上]fp,都远远超过他们。
从例句中可以看出,作为并列标记,逗号和顿
54
第1期 上海师范大学学报(哲学社会科学版) 2003年号没有太大区别,不同作者会有不同的语言习惯,从我们所考察的语料来看,顿号要比逗号常用。
(5)并列成分末尾加 也罢或 也好,构成 无论/不论/不管∃∃也罢/也好,∃∃也罢/也好格式:
zw:无论[他说因为穷拾东西不坍台]zw也罢,[我虚荣清高、死要面子活受罪]zw也罢,我决不允许他把挑选出来的两件呢大衣带进屋。
v p/v:无论[准备答题]vp也罢,[和陌生人打交道]vp也罢,都要事先作好准备,这样你才能应对自如。
ap/a:无论孤独a也罢,烦恼a也罢,我们统统可以对之微笑。
np/n:不管[体力劳动]np也好[脑力劳动]np也罢,都从来不是他的谋生手段。
因为介词短语和方位短语只能作定语、状语或补语,而 也好、 也罢是语气词,只能出现在句末或话题性主语后面,所以介词短语和方位短语不能进入 无论/不论/不管∃∃也罢/也好,∃∃也罢/也好框架。
(6)成分与成分直接并列,一般都是由意义相反或相对的词(或语素)组成:
无论平时光景孬好,端阳节的一顿好饭总是不会少的。
无论生前死后,都受到包括 北佬在内的美国人民的一致崇仰。
不论长短,他得先有个落脚的地方。
(7)然否式,有 是否、 与否、 能否 &不&等,即 无论/不论/不管∃∃是否∃∃, 无论/不论/不管∃∃与否, 无论/不论/不管∃∃能否∃∃, 无论/不论/不管∃∃&不&∃∃:群众的意见无论正确与否,领导都应该认真听取。
不管孙玉亭反对不反对,春节前,卫红和金强相跟着地去石圪节乡领了结婚证。
(8)几种并列标志综合使用,它们并不处在同一层次上:
在这个意义上,无论征文来稿见报与否,见报作品获奖与否,来稿者都是所见相同的英雄。(逗号连接更高层次)
(9) 无论类连词同现。把 无论类连词同现当作标记格式来处理,对整个句子(单句或复句)的句法分析和语义理解是很有帮助的。常见的形式如下:
不论∃∃不管∃∃:
汽车迎头来了,卷起地上所有的灰土,祥子不躲,不论汽车的喇叭怎样的响,不管坐车的怎样着急。
不管∃∃不论∃∃:
不管在以前还是在以后的中国文科考试中;也不论大、中、小学,一律都在基本规定的 教学大纲的范围内。
无论∃∃不论∃∃:
无论我们曾经历了多少痛苦和磨难,且还将要面对多少严峻考验:也不论我们处于何种位置何种境地,我们都会为能服务于伟大的祖国和如此众多的同胞而心甘情愿地献出自己毕生的精力和才智。
不管∃∃不管∃∃:
两年以后,就在今天,这同一个时刻,不管我们那时在何地,也不管我们各自干什么,我们一定要赶到这地方来再一次相见∃∃
无论∃∃无论∃∃:
不合理就该变革,无论你是多高级别的部门(企业),无论你在中国还是美国。
无论∃∃无论∃∃不管∃∃不论∃∃:
每一习俗都自有其道理,无论用的是锡盘子、木盘子或陶土盘子;食物无论是煮或烤;不管下的是牛油、胡桃油;不论是冷盘或热食,我都视之如一。
这些句子和一般的并列式比较,有明显的区别,那就是每一个 无论类连词都各自构成一个无条件的条件,然后每一个条件再互相结合,共同构成一个总的无条件的条件,最后再与结论对立。从理论上说各 无论类连词互相结合的可能是无限多的,但实际上是有一定形式特征的。首先, 无论类连词连用,一般不会超过4个;其次,如果其中有 无论这个词,它总是在最前面,一般不会出现 不管/不论∃∃无论∃∃的形式;再次,从第二项以后, 无论类连词前面可以加 也。
2 用表示任指的代词表示一个包含无限变体的条件:
有些条件句中不用选择性并列成分,而是用表示任指的代词(包括所有的疑问代词)和指示代词 任何)或副词 多、 多么表示一个包含无限变体的条件。除了 多、 多么只能做状语外,
55
由丽萍 厉霁隽: 无论类连词在句法分析中的标记功能其他词的句法位置都比较灵活:
主语:他两个不论谁过生日,他妈或田大婶总要给他们把一圈白线用红颜料染好∃∃
谓语:无论成败如何,其意义都将是巨大的。
宾语:她无论做什么,都是有道理的。
定语:无论您是什么官,他都有可能撤掉您以平的。
状语:无论平静日子过多久,上海总还会刮台风。
补语:不管他做得如何,大家都不会领情。
在量词前,构成数量结构:无论哪种比赛,观众都可以靠近赛场观看比赛。
单独出现在条件部分:无论谁,都不能这样随便地答应人家。
3 有时,由 无论类连词连接的条件部分既含有疑问代词又含有并列标记:
无论那些人如何振振有词,如何以为真理在手,仅从他们发言时的态度,我们就可以断定,我们对中国电信的担心、担忧和操心都不是没有根据的。
通过观察语料,我们发现 无论类连词连接无条件的条件,方法不外乎以上所说!!!并列、任指或二者皆用。所以可以制定一条切分规则!!! 无论类连词连接的两个单位中,条件部分必须包含选择性并列成分或表任指的疑问词(具体形式依据以上的描写),反过来如果条件内部既没有表任指的疑问代词,也没有并列结构标记,就证明是错误的分析,需要重新调整。利用这条规则,往往可以解决条件短语边界过小的问题。例:误:[无论是具象的]或是抽象的都进入了美术的领域。
正:[无论是具象的或是抽象的]都进入了美术的领域。
通过以上的分析,我们还可以制定一条句法关系标注规则:当条件部分为zw、vp、ap时,条件部分和结论部分共同构成一个复句或紧缩复句,前者条件部分与结论部分之间由标点隔开,后者条件与结论之间没有停顿标记(对于各 无论类连词同现的复句来说,则是各条件部分先构成复句形式,再和结论部分结合成一个更大的复句)。而当条件部分为np时,与结论部分构成主谓关系(对于 无论类连词同现的句子来说,则是各条件先构成并列式np,再和结论部分构成主谓关系)。当条件部分为fp、pp时,与结论部分构成状中关系(对于各 无论类连词同现的句子来说,则是各条件部分首先构成并列的fp或pp,然后再和结论部分构成状中关系)。
三、无条件的条件句中,结论部分经常有一些副词或连词与条件呼应。提供这样的信息,对这种条件句的分析与生成是很有帮助的。它们包括: 都等总括性副词∗; 但、可类转折性连词或副词+; 还是,也等表示让步关系的关联副词。因为 无论类连词统领的是总括式的条件,所以自然经常和总括性副词连用;同时无条件的条件句本身隐含着转折性和让步性−,所以有时和 但,还是,也等搭配。当计算机分辨出了条件内部的格式标记,但条件与结论的分界点仍然比较模糊时,这些词无疑是有效的鉴别手段。
这三类词之间并不互相排斥,它们有时共同出现在结论部分,有时某两类词出现在结论部分,有时只出现一类,当然,有时三类词都不出现。正是由于这些词并不总是出现在结论部分,所以我们还不能一刀切,认为结论部分必须含有这些词。但我们可以给出识别条件与结论的分界点的充分非必要条件,即在表示条件的格式标记后面如果出现了这些词,那么就能断定其所在短语是结论或属于结论部分,而不属于条件部分。利用这种规则,计算机可以消除一些由于条件部分短语边界过宽造成的切分错误,例如:
误:[无论谁都劝不动他],干脆算了吧。
正:[无论谁]都劝不动他,干脆算了吧。
根据标记性框架,计算机可以肯定 谁属于条件部分,但后面的 都劝不动他属前属后就很难判定;又因为逗号是比较强的分界标记,所以做了错误的处理。而如果运行 .都/类词属于结论部分,不属于条件部分的规则,就可以纠正这一错误。对应这三类词,有三条规则,具体如下:
A 如果表示条件的格式标记后面有 都类总括性副词,那么 都类词所在的短语是结论或属于结论部分,而不属于条件部分。
B 如果表示条件的格式标记后面有 但类转折性连词或副词,那么 但类词所在的短语是结论或属于结论部分,而不属于条件部分。
C 如果表示条件的格式标记后面有 还是、也类表示让步关系的关联副词,那么 还是、也类词所在的短语是结论或属于结论部分,而不属
56
第1期 上海师范大学学报(哲学社会科学版) 2003年
于条件部分。
为了避免不必要的重复操作、解决规则间的冲突,需要按照一定的策略对规则进行排序。我们采用的是专一性排序0,如果三类词或某两类词同时出现在表示条件的格式标记后面,则针对最左边的那类词的规则具有较高的优先级,执行了优先规则以后,系统不再执行其他规则。如: [不管活在这世界上有多苦],但你总归还是那么爱这世界!
这里, 但、 总归、 还是都出现了,其中 但在最左边,所以运行规则B,在 但前切分。如果三条规则都运行或顺序颠倒,就会造成不必要的重复甚至错误分析。
四、余论
本文只是对 无论类连词进行了分析,现代汉语中还有许多虚词都能形成一定的格式框架,提供这样的信息,对中文信息处理是很有必要的。在纷繁复杂的语言现象中找出标记性词语,概括出形式化的特征,还有大量工作要做。
注释:
∀本文采用方括号标记短语的左右边界,在右边界外面注明该短语的类型。出现在本文的标注符号说明:
np:名词性短语vp:动词性短语zw:主谓短语ap:形容词性短语pp:介词短语fp:含有方位词的短语
fj:复句
c:连词
v:动词
vN:名动词
p:介词
n:名词
u:助词
d:副词
a:形容词。
%定义见刘开瑛(2000)第60页。)包括:多少、何、何处、何时、几时、哪、哪边、哪儿、哪个、哪里、哪些、哪样、如何、啥、甚么、什么、什么样、谁、为何、为什么、怎、怎么、怎么办、怎么样、怎样、咋。
∗总括性副词包括:都、总、总归、总是、总之、始终、终归、最终、终究、到底、一直、反正、全、皆、尽、通通、统统、全都、同样、一概、一律、均、全然、老、老是。
+转折性连词或副词包括:但、但是、可、可是、却、并、不过、而、然而。
,表示让步关系的关联副词包括:还、还是、也、仍然、仍旧、依然、照例。
−邢福义(2001)463-465页。
0刘开瑛(2000)第137页。
参考文献:
[1] 范开泰等 关联词语[M] 上海:上海教育出版社,1981
[2] 范开泰,张亚军 现代汉语语法分析[M] 上海:华东师范
大学出版社,2000
[3] 冯志伟 自然语言机器翻译新论[M] 北京:语文出版社,
1995
[4] 胡明扬主编 词类问题考察[M] 北京:北京语言学院出版
社,1996
[5] 刘开瑛 中文文本自动分词和标注[M] 北京:商务印书
馆,2000
[6] 吕叔湘 现代汉语八百词(增订本)[M] 北京:商务印书
馆,1999
[7] 宋秀令 谈几对关联连词的功用[J] 中国语文,1979(1)
[8] 宋玉柱 再谈关联词语在单句成分中的连接作用[J] 汉语
学习,1990(2)
[9] 邢福义 汉语复句研究[M] 北京:商务印书馆,2001
[10] 俞士汶等 现代汉语语法信息词典详解[M] 北京:清华
大学出版社,1998
[11] 现代汉语虚词[M] 上海:华东师范大学出版社,2000
T he S ign Fu nction in S yn ta ctic Parsing of th e C hinese C o njun ctions like
Wu Lun:a Case Study of Modern Chinese for Information Processing
YOU Liping,LI Jijun
(Humanities College,Shang hai T eachers U niversity,Shanghai,200234,China)
Abstract:T he know ledge for Chinese information pr ocessing is inadequate and the syntactic constituents,syntactic functions and semantic relations in modern Chinese are very complicated.T herefor e,thi s article puts for ward a kind of natural language analysis driven by signs and framewo rks and makes an analysis of the co njunctions like wu lun.Based on a detailed description of the syntactic distr ibut ion of this kind of conjunctions,the article sums up a series of framew orks w ith signs and establishes the r ules of automatic analysis.
Key words:natural languag e processing,Chinese information processing,tag ging function,conjunctions
(责任编辑:卢大中)
57
由丽萍 厉霁隽: 无论类连词在句法分析中的标记功能下载本文