- 基于认知形态学的汉语类词缀构词研究
- 张未然
- 2984字
- 2025-03-28 19:18:45
1.3 研究方法
与美国结构主义语言学和生成语法“注重研究语言能力”不同,功能语言学和认知语言学都主张“对语言结构的研究不能脱离语言使用”,因此它们都“致力于创造一种在‘基于用法的理论’(usage-based theory)下的研究范式”(Bybee,2006: 711)。在认知语言学家看来,语法“是在语言的用法中涉及的认知和心理加工过程造成的动态系统”(Hamawand,2008: 24),而“语言的用法可以解释为什么语言中存在语法以及语法以何种形式存在” (Bybee, 2006: 730)。
根据 Hamawand ( 2008: 24 -25 ),基于用法的语言学( usage-based linguistics)有三条重要的主张:“关注语言的用法”;“同等对待语言能力和语言表达,语言系统的知识和语言使用的加工过程之间存在交互作用”;“排斥规则清单谬论,词库(不规则形式的清单)和语法(规则形式的清单)之间的差异是模糊的,语言的网络模型应该是既包括抽象的语法类型,也包括它们的词汇实例”。
本书也将采取基于用法(usage-based)的研究方法,具体来说包括:
1.语料库研究法
语料库,“顾名思义就是存放语言材料的仓库(或数据库)” (黄昌宁、李涓子,2002: 1),“现在人们谈起语料库,不言而喻是指存放在计算机里的原始文本或经过加工后带有语言学信息标注的语料文本” (顾曰国,2003)。根据李福印(2008: 37-38)的统计,语料库已经成为认知语言学最热门的研究方法之一。
语料库对于本研究的价值主要体现在以下两个方面:
其一,语料库能为我们提供真实的、新鲜的类词缀构词的数据。我们可借助语料库对类词缀的派生规律进行穷尽式地统计分析,与修订周期一般较长的词典不同,语料库尤其是动态语料库可以反映语言的发展变化,帮助我们观察类词缀的动态使用情况。
其二,我们还可借助语料库考察类词缀派生词的搭配情况。在研究类词缀派生词对项时,我们将从它们的搭配入手发现它们语义上的差异,从而确定这组类词缀在识解上的区别。例如,我们统计了CCL语料库中“新式”和“新型”的常见搭配,发现“新式”更经常和“家具、大楼、服装、工装、旗袍”等外在形式凸显的具体事物搭配,“新型”则既可以和具体名词,也可以和抽象名词搭配,如“人才、毒品、病毒、关系、爵士乐”等,这说明,与“新型”相比,“新式”侧重于指样式新,“新型”则强调对原有事物的性质上的革新。从识解的角度来解释,“新式”被识解时凸显的是外观,而“新型”凸显的则是核心。
综合考虑国内现有语料库的优缺点,我们决定选择以下语料库作为语料来源:
(1) 国家语委现代汉语语料库,网址:http://corpus.zhonghuayuwen.org/CnCindex.aspx (访问日期:2022-04-11)。
(2 ) DCC 动态流通语料库,网址: http://dcc.blcu.edu.cn/main.action1。
以上两个语料库是本研究首选语料库,它们的优势在于:规模大,国家语委现代汉语的语料规模达到了1亿字符,DCC语料库的规模则达到了100亿字次;已经分词,并且带词类标注,基于语料库的词汇研究最大的问题就是有效语料的提取,目前国内大部分汉语语料库中的语料都是生语料,未经分词也没有词性标注,以CCL语料库为例,如果我们想要检索类后缀“-家”,只能在CCL语料库中采用字符检索的方式输入“家”,检索出来的结果除了包括“X家”之外,还会包括“家庭、家园、一家人、家家户户”等众多不属于我们研究范围的词,这就给我们的统计带来了很大不便,我们利用国家语委语料库和DCC语料库中的分词和词性标注就可以快速、高效地将全部以“家”结尾的词提取出来(将检索条件设置为“家/n.”),再辅以人工筛选,就能将类词缀“家”的派生词确定下来了。
我们之所以同时使用这两个语料库的语料,主要是因为国家语委语料库虽然是平衡语料库,但语料相对来说略为陈旧(最新的语料为2002年),从2002年到2020年2已经有不少新词语出现,也有很多新兴的类词缀产生,如“-控”(微博控、蛋糕控),而DCC语料库是动态流通语料库,它能够保证我们研究语料的新鲜程度。
(3) BCC现代汉语语料库,网址:http://bcc.blcu.edu.cn(访问日期:2022-04-11)。
它作为本研究的备选语料库。在本书修改的过程中,DCC语料库由于技术问题一直无法打开,于是我们在补充的类词缀(主要是部分新兴类词缀)构词研究中使用了BCC语料库,它的优势在于语料规模大(150亿字),支持分词检索,除了报刊、文学语料外,还包括微博语料,能够全面反映当前的语言生活。
(4) 北京大学 CCL 语料库,网址: http://ccl.pku.edu.cn:8080/ccl_corpus/(访问日期:2022-04-11)。
在本书第五章“汉语类前缀对项的构词识解”及第八章“汉语类后缀对项的构词识解”中,我们使用北京大学CCL语料库来验证派生词对项的搭配频率。
2.定量和定性研究相结合
基于用法的语言学强调语言使用频率的重要性,“对于说话人来说,语言变体并非都处于同等地位”,“这些语言单位通过频率和搭配获得巩固的地位,那些出现更频繁的语言单位在语言系统中的地位更为稳固”(Hamawand,2009: 19)。因此,定量研究方法在基于用法的语言学中使用得十分频繁。
本书也将主要采用定量研究方法。通过对语料库中类词缀派生词的穷尽性统计,我们能够发现该类词缀构词时的不同语义模式,确定该类词缀的原型义项,因为原型义项的出现频率在其范畴中往往是最高的。例如类后缀“员”表示“工作的人” (如“乘务员、飞行员”)时的类型频率3为296,表示“某组织的成员”(如“党员、团员”)时的类型频率为30,所以“员”的原型义项为“工作的人”。
与定量研究不同的是,定性研究方法注重对研究的对象进行“质”的分析,更侧重于对事物的含义、特征、性质等的描写和解释。如果说定量研究方法能够帮助我们对不同类词缀构词时的内部结构和语义模式有精确的了解,定性研究方法则可以让我们在此基础上进一步探知诸如近义类词缀构词时各有什么样的选择限制,以及如何从认知角度解释它们构词的共性和差异等。
3.在描写的基础上解释
想要深入研究类词缀的构词,首先就必须对各个类词缀的派生情况进行具体和详细的描写,比如和它结合的词基在词类、语义方面有哪些要求,在范畴化的过程中可结合词基的地位是否平等等。以类词缀“家”为例,首先我们将具体描写它在原型义项和边缘义项下与不同类别的词基结合时产生的语义变体,以及这些语义变体构成的派生词等。
为构词规律提供解释是认知形态学的终极目标,也是本书的最终目的。我们将尝试从认知视角解释以下问题:某些类词缀(如类前缀“零、软、硬”)的指称化作用,类后缀的兼类,近义类词缀附加在相同词基上时所反映出的人们的识解差异等。
4.共时和历时研究相结合
本书是针对汉语类词缀构词的共时研究,主要表现为:
重点研究现代汉语中组合能力强、能产性高的类词缀的构词规律;
研究各类词缀的内部语义分化时,以现代汉语语料库中的语料为基础,对各类词缀的派生词进行穷尽性统计,以发现不同类词缀派生时的结构和语义生成规律;
对汉语中的近义类词缀做对比研究时,重点关注它们在现代汉语中的构词的选择限制和识解差异。
类词缀的产生往往是词根虚化的结果,这种虚化不是一蹴而就的,而是在使用中逐渐形成的,因此本书虽然属于共时研究,但仍离不开历时考察,这一点主要体现在两个方面:一是在讨论各类词缀内部语义分化时,我们将结合历时语料分析其产生的过程,即它是如何从词根虚化而来的;二是当我们分析近义类词缀的识解差异时,我们也会尝试从历时角度对它们的识解差异作出解释,类词缀从词根虚化而来,人们附加在其上的识解差异往往是受了它们作词根时的词汇意义的影响。
1 本书所用DCC语料库的检索时间为2015年11月至2016年3月,该语料库现已无法打开,国家社科基金项目结项修改书稿时换用了BCC语料库。
2 本书的主体研究完成于2020年末,因此语料检索也是到2020年为止。
3 类型频率指的是一个语言表达式在语言中的具体出现的次数,例如我们在DCC语料库中共检索出类词缀“零”构成的派生词170个,那么它所构成的派生词的类型频率就是170。