图书简介
李葆嘉
作为一本具有开拓性的现代汉语释义元语言研究专著,安君华林的博士论文经修订即将付梓。新年伊始,接到索序电话,我便沉浸在教学相长的回忆中,重温华林的论文几稿,探索道路上的一个又一个足迹并呈现出来……
一
1997年秋,给研究生开设“当代中国语法学理论”。在讲述、讨论和专题研究的基础上,与诸生合撰《中国转型语法学》,导论《论20世纪中国转型语法学》刊《徐州师范大学学报》2002年第1期。基于对东西方语法研究合流曲折历程的思考,明确提出“人类语言的本质属性是语义性”以及“语形语法”和“语义语法”的二分,并进一步尝试建构“语义语法学”的理论和方法。其基本观点见《论语言科学与语言技术》(2001年中国语言学会年会论文,载《中国语言学报》第11辑,商务印书馆2003),系统阐述载《理论语言学:人文与科学的双重精神》(江苏古籍出版社2001)。2001年秋,申报江苏省哲学社会科学基金项目“面向语言工程的语义语法学研究”,次年1月立项。
描写主义认为语义是“流沙”,中国学者认为语义是“黑洞”、语义研究是“泥潭”。我以为语言好比一座冰山,语形语法是冰山上部,而隐藏在海水下面的语义部分至今未明。尽管如此,20世纪70年代以来,随着国际语言学从语法到语义的转移,中国学者的目光开始逐步关注现代语义学。语义是语言的本质,语义贯穿语汇、语法和语用,语义语法学研究语义词类、语义句法和语义章法三个层面。语汇或词汇的语义研究自然是其基础。然而多年以来,作为词汇语义研究的集中体现,词典释义方法一直停滞不前。至于词汇有无系统之争,其关键不在是否存在系统,而在如何建构系统。词汇学专著一本又一本,谁也没给出一个汉语词汇系统。其困惑在于,面对词量的开放性和释义的随机性,没有找出一条切实可行的研究思路。经过潜心思考,我提出语义语法研究的内核模型、受限方法、义位界定和元语言释义理论,制定了可操作性程序。
虽然“元语言”这一概念,逻辑学界早在20世纪30年代(A.Tarski 1933,R.Carnap 1934)已经提出,就自然语言的元语言研究,20世纪70年代以来也形成了以魏尔兹比卡(A.Wierzbicka,旅澳波兰学者)为代表的波兰学派和以Ю.Апресян为首的莫斯科学派,然而国内却长期未见现代汉语元语言研究的专门文献。国外的自然语言元语言研究状况,苏剑芳的《〈语义学:原词与普遍性〉评介》(《外语教学与研究》1999年第1期)可能是国内第一篇介绍魏尔兹比卡研究成果的文章,2002年年底又有两篇专门介绍(张家骅《Ю.АПРЕСЯН/A.Wierzbicka的语义元语言》,《中国俄语教学》2002年11月和次年2月刊;卢植《自然语言元语言论与语义分析》,《外语学刊》2002年第4期)。
2001年12月,在厦门大学主办的“全国汉语词汇规范研讨会”上,我们所提交的《论现代汉语元语言系统研究》(与安华林合作),是国内第一篇关于现代汉语元语言研究的论文。2002年8月,我在《南京师大学报》第4期上发表的拙作《汉语元语言系统研究的理论建构及其应用价值》,是国内第一篇现代汉语元语言专题研究的期刊文献。现代汉语元语言研究的理论建构和操作方法,是在受词典中的“元语言”词条以及逻辑学相关论述启迪,未知国外自然语言元语言研究的情况下,在世纪之交独立思考的些微结果。这一期间,我与段业辉教授交谈过此思路,得到赞同。
2001年春,信阳师范学院安君华林前来报考博士生。确定录取后,7月20日给华林写过一封电邮:
华林:
你的研究方向是汉语语义。专题是“现代汉语元语言系统研究”,材料主要是《现代汉语词典》,目标是提取出现代汉语的元语言系统。其理论价值是就个别语言的元语言研究以揭示一般语言的元语言理论,其应用价值是词典释义和语义描写。这一专题意义重大,属于语义系统描写的基础工程。
具体步骤大致如下:1.依据《现汉》,将其释义句中的用词汰除重复,列出释义用词清单。2.将释义用词清单进行语义分类,汰除同义词。3.依据合适的义场框架,列出释义元语言词表。4.利用释义元语言词表,例释现代汉语的典型词。5.利用释义元语言词表,做出语义系统描写的样本。
请注意购买语义学和计算语言学论著。希望在假期就这一专题进行思考。另外,文学院日前成立了语言科学及技术系,南京师大语言学学科正处于良好氛围中。
同年8月29日,在草拟的“现代汉语元语言系统研究”课题中形成以下特色:选题价值部分强调:元语言是人类认知中的经验性基本义位,元语言系统研究是语义学、词汇学、词典学乃至句法学的核心课题。迄今为止,现代汉语元语言研究仍是空白。本课题的研究材料主要依据《现代汉语词典》(电子本),研究目标是创立和完善元语言理论和方法,建构现代汉语元语系统。本课题的理论价值是就个别语言的元语言研究以揭示一般语言的元语言理论,应用价值是为辞书编撰释义、词汇系统归纳、语义系统描写和面向信息处理的语义形式化提供依据。技术路线部分提出:1.分解释义用词,2.汰除同形用词,3.合并同义和近义用词,4.归纳义位词元,5.建构释义元语系统,6.通过验证增删词元。理论创新部分提出:根据不同标准和要求可建构具有不同层级及其应用功能的元语言系统:1.日常感知元语言系统(又称“习得性元语言”,后定名为“词汇元语言系统”)——日常言语使用;2.词典释义元语言系统——词典释义使用;3.信息处理元语言系统(又称“语义元语言”、“机用元语言”,后定名为“析义元语言系统”)——信息处理使用;4.人类认知元语言系统(又称“普遍元语言系统”)。归纳起来就是:一个核心、六大步骤、四个层级。
二
2001年9月,华林来金陵读博,我们经常一起讨论元语言话题,同时准备申报国家基金课题。作为合作项目,我侧重于理论建构和路线设计,华林侧重于资料搜集和微观研究。首先合写出的是《论现代汉语元语言系统研究》。
12月,应苏兄新春之邀,去厦门大学出席“全国汉语词汇规范研讨会”,我提交了该文初稿(后收入苏新春、苏宝荣主编的《词汇学理论与实践(二)》,商务印书馆2004),展示了元语言研究的基本观点和研究途径。其时提交的摘要如下:
与“对象语言”相对的“元语言”(metalanguage)又称“纯理语言”或“符号语言”。广义的理解既包括辞书编撰和语言教学中用于释义的用语,又包括语义研究中标记语义特征并用来分析和描写对象语言的符号系统,狭义的理解仅指后者。以往的元语言研究,一方面表现在“最低限度词汇”的编制中,一方面表现在义征标记的提取中。尽管存在不同意见,但最低限度词汇的规模大致在1500左右。在中国,贾彦德是较早引进义素分析法来研究汉语语义的学者之一,随着汉语语法学界引进格语法、配价语法和题元理论,语义特征在句法研究中得到重视。近年来,为满足信息处理需要,一些计算语言学家提出的知网、HNC等,也都自觉不自觉地涉及元语言问题。
迄今为止,国内对最低限度词汇研究的成果未见,尽管出版了多本词汇学著作和大批词典。同样,也没有见到完整的人机两用的现代汉语语义元语系统。多年来的词典学、词汇学、语义学以及计算语义学研究在理论方法、体系建构等方面之所以裹足不前,就是因为尚未对汉语元语言这一应用性基础工程从事深入研究,深层原因就是没有跨入元语言基本理论和研究方法这一领域进行拓荒性探索。
毋庸置疑,这一研究对于词典编撰释义、词汇系统建构、语义特征分析和语言信息处理以及汉语词汇规范等都具有明显的重大价值。从应用立场出发,现代汉语元语言研究是自然语言模拟的基础工程,只有完成了元语言研究,汉语的语义网络才能真正建立,句法结构的计算机理解和生成才能逐步实现。从理论立场出发,只有把某些典型的自然语言的元语言研究清楚,才有可能建立人类普遍元语言系统。汉语元语言研究的理论目标,就是通过个别语言的元语言微观研究以揭示一般语言的元语言宏观理论。
本文的主要观点是:1.元语言是“对象语言”的解释性符号系统,这一系统植根于认知经验中的基本“意象”。元语言研究的表层是最低限度词汇的规模设计,其本质是认知性语义场的模式建构。2.元语言研究必须建立在元语言体系层级观、元语言义位理论以及元语言具有不同表述方式的理论基础之上。3.现代汉语元语言系统研究具有紧迫性和可行性,其成果可以随机抽样法检验系统建构的适度性和操作性。4.现代汉语元语言研究的应用价值是:为汉语教学和词汇规范提供最低限度词汇表;为汉语词典释义提供通用释义词项表;为汉语词汇研究提供词汇分类系统框架;为汉语语义分析提供义征标记集和义场模型;为汉语信息处理提供语义分析基础。
现代汉语元语言系统研究的最终成果是:《现代汉语元语言系统研究》(专著)和《现代汉语元语言系统应用》(软件)。随着这些成果的出现,本研究也就在词典学、词汇学、语义学、语法学、语言教学和计算语言学方面取得了一系列重大突破,中国学者的元语言研究理论、研究方法和模式建构也就走到了国际前列。
摘要中提及的“元语言体系层级观”,在论文中表述为:
语言学的元语言包含三层含义:用于语言交际的最低限量的日常词汇,用于辞书编纂和语言教学的释义元语言,用于语义特征分析的析义元语言。除此以外,还有两种类型。如果以信息处理为任务,可在上述成果基础上,进一步研究机用元语言系统。如果以提取普遍认知范畴为目标,可以多种语言的元语言研究成果为基础,进一步研究用来解释人类语言意象单位和意象关联的认知元语言系统。
不同层次的元语言研究,得出的元语言单位不同:
元语言研究的对象包括“语元单位”(简称“语元”)和“语元关系”(语义关联)。词汇元语言中的语元相当于日常语言的基本词项,释义元语言中的语元相当于词典释义中的必用词项,现统称之为“词元”。析义元语言中的语元单位,通常用义素、义征、语义标示语、语义元语、义元等术语表述,现与机用元语言系统中的语元单位统称之“义元”。认知元语言中的语元单位即认知元,则称之为“知元”。从而可以得出不同类型的元语言集:最低限量词汇集、释义元语言集、义征标记集以及认知元语言集。
该论文在大会宣读以后,引起与会代表的关注。一些同仁问:你在国外待过几年?我笑而答曰:没有去过国外,这一理论是闭门造车的本土理论,我是反索绪尔主义和乔姆斯基理论的,尽管其中有些观点和方法可取。
2000年是我语言学研究转向的分水岭。在这之前,我主要从事传统语言学、人文语言学研究,之后,逐步转向语言信息工程学研究。作为多年老友,苏兄新春在几年前已从传统词汇学转向词汇计量研究。新春闲谈中提及:80年代相熟的一批研究生,现在仍然活跃在前台的没几个了。你的研究结果还没出来,理论却先出来了。我说:我的习惯是理论和方法先行,特别像这类工程课题,需要倾注无穷无尽的时间和精力,陷进去就拔不出来。如果没有理论方法的预先建构、操作路线的可行性论证和最终成果的可预期性,不会轻举妄动。
2002年4月,“现代汉语词典释义性词语的计量分析”列入南京师大特色优势学科建设“语言学及应用语言学”项目;5月,“现代汉语元语言系统研究”纳入南京师大221工程教学项目(资助博士点建设和博士论文优秀选题);6月,国家社科基金课题“面向信息处理的现代汉语元语言系统研究”批准立项。
2002年3月,我以“现代汉语元语言研究”为“研究大纲”申报香港浸会大学“中国内地访问学人计划”,通过遴选后,对方来函邀请做一学年的访问学者。5月,在全国符号学会议上,应顾嘉祖教授的邀请,作“现代汉语元语言研究”专题演讲。与会代表说:这么多的报告,只有你讲的是自己的理论。一位旅美学者鼓励道:这样的设想在国外没听说过,研究出来一定会推动国际语言学的发展。这一阶段,我对元语言理论方法和技术路线的进一步思考,见《汉语元语言系统研究的理论建构及其应用价值》(《南京师大学报》,2002年第4期)。
三
释义元语言研究的主要语料,我们选择最通行的《现代汉语词典》(简称XH)。2002年春,我和华林就开始四处搜求与购买电子版本。经过几个月周折,非常遗憾,有XH电子版本的同仁虽不止一位,然皆恕不提供,或顾左右而言他。
2002年6月,也就是华林就读一学年即将结束前,我们决定自己制作《XH电子文本》。为之,嘱华林先起草《现汉文本工作流程及进度》,随后我修改增补为《XH电子文本制作及XH释义词计量分析工作计划书》。这一任务的繁重性可以预知,整个暑假华林都得围着电脑一页一页地扫描,接下来还有大量的校对……
7月中旬,华林从信阳师院来信说做得很辛苦。从暑假期间往来的电子邮件中可略见一斑。
华林:
研究学术很辛苦。我常对家人说“得夜以继日”。虽然后面的任务仍然相当艰巨,但是只要开始做,就会一步步有结果。既然走上了学术道路,可谓“箭在弦上,不得不发”,而“开弓没有回头箭”。
发去《工作计划书》修改稿,请提出意见。时间很紧,考虑到2003年下半年务必完成博士论文,因此这一“XH释义词计量分析研究”必须在当年上半年完成。进度方面,我作了一些调整。基本依据是前后流程可交错进行。参与校对的几位研究生以及计算机系的曲维光老师,我已和他们谈过。等你来校后,我再将大家集中起来商量一下。
李葆嘉 谨启 7月20日
李老师:
发来的《工作计划书》考虑很周详,我提不出什么意见。不过,根据我一个月的操作体会,时间紧,任务重,必须各方全力投入才有望完成。这一个月来我不停地干,才完成了扫描录入、text分页文本存档(1689个文件)、word文件存档、初校(23个文件)等工作。需要说明的是,word分页文档没有继续做,一来已没有了时间,二来觉得没有必要。如果您觉得有必要,再补。
华林 7月28日
关于华林的博士论文题目,也在反复斟酌之中。
李老师:
学生想把论文题目抓紧定下来,以便思考论文框架,平时有所感想可以随时往里填充。您原来说的题目是:1.《现代汉语释义元语言和词汇元语言研究》。受您的启发,学生想出两个题目——《现代汉语词汇元语言研究》、《现代汉语基元词研究》。
题目1,学生觉得概括全文比较细密,但释义元语言范围过大,我们研究的只是释义词汇;而且词汇元语言外延上包括释义元语言,不宜并列。题目3和我们说的词汇元语言是一回事,主要是为了避免关于“元语言”的不必要争论。题目2倒是比较适中。以释义词汇元语言为基础,结合频率词典的高频词、方言基本词、对外汉语教学基本词,优选出现代汉语词汇元语言。分析当否,请先生定夺。
华林 8月28日
开学以后,我与华林继续就论文选题交换看法。我的意见是,依据元语言系统的层级性,词汇元语言并不包括释义元语言。
词汇元语言系统是处于词汇功能层面的用来进行日常交际的最低限量词汇,也可以称之为“习得性元语言”。其主要功能用于语言教学中的择词依据。无论是群体语言的发生发展,还是个体语言的习得发展,词语总是从少到多。最低限量词汇不仅反映日常熟悉的基本事物、基本动作及基本关系,可以作为日常语言活动的工具,而且这些词语也是分化为其他衍生词语的词元,可以作为语言能力继续发展的基础。相对于整个语言系统而言,最低限量词汇天然具有“元”性质,因此可以看作一种元语言。
释义元语言系统是处于词汇功能层面的用来解释对象语言的基本词项集,其主要功能用于辞书编纂中的意义阐释。用来指称这一系统的术语有释义词汇、定义词汇等,现定名为“释义元语言系统”。虽然从规模来看,释义元语言系统可能表现为一种语言的最低限量词汇,但是作为词典释义的必用词语,需要在最低限量词汇的基础上根据释义要求优化。在词典释义中,固然可以像通行词典那样采取不限量词语进行释义,但是如果采取释义元语言系统,词典释义无疑将具有简约性和通俗性的优势。
(《汉语元语言系统研究的理论建构及其应用价值》)
根据元语言研究工程的循序渐进性和逐层抽象建构法,首先必须做词汇元语言和释义元语言,至于析义元语言,只有基于前两个层级的成果方能进行。如果只研究“现代汉语词汇元语言”,相当于基本词表的重建,难以作为一篇博士论文的内容,因此我建议题为《现代汉语释义元语言和词汇元语言研究》。这一“释义元语言”只是“释义性词元”,并不包括“释义元句法”。“释义元语言”首先针对日常词汇进行释义,因此又务必同时提取“词汇元语言”。虽然可以认为,“释义元语言”是“词汇元语言”的优化系统,但是思路应是以前者释后者,更大范围词语的元语言释义是以后的任务。
华林信中提出“现代汉语基元词”,“基元”(primitive)这一术语来自计算机科学,含义是机器指令和翻译的最小的或最基本单位。引入语言学的“基元词”,要看如何定义。如果是“日常语言释义的基础性词元”,那么与“释义元语言词元”等价。
可以进一步思考的是——meta的含义是什么?汉语的“元”在何种含义上对译meta?
英语meta的含义大致如下:
①伴随/在其后
metabiosis[生物学]后继共生,半共生,随从生活。
metaderm[生物学]后生皮层。
②以…为基础/基于
metabiology[哲学]超生物学,建筑在生物学上的认识论。
metaethics[哲学]元伦理学,研究伦理学基础的哲学。
③基础的
metaclass[计算机]元类。
metacode[计算机]元代码。
metaassembler[计算机]元汇编程序。
metalogic[逻辑]元逻辑。
metacommunication[信息学]元信息传递。
汉语“元”的含义比较复杂。《说文》:“元,始也。从一,从兀,象人首形也。”《孟子》:“勇士不忘丧其元。”由本义“人首”而来的引伸线索如下:
“元”为人之始(婴儿出生见首),“初”为裁衣之始。由此引伸为——
①起初:元始 元初 元来 元由 元因 元配
变化后的事物可还原,“元”引伸为——
②本来:元物 元金 元心(本心) 元名 元身
“本”为木(树)之始,“根”与“本”义同,由此“元”引伸为——
③根本:元本 元极 元气 元素
“元素”一词既具有“元”(起始)性,又具有“素”(要素)性。“素”的语义感染促使“元”引伸为——
④要素:元件 单元 题元 论元
居首位则第一,由此引伸为序数——
⑤第一:元旦 元年 元首 元妃 元子 状元
第一为最高等级,则可引伸为——
⑥最高:元勋 元老 元功
最高的也是为主的,可再引伸为——
⑦主要:元帅 元戎 元音
《春秋繁露·垂政》:“元,犹原也。”“原”(像泉水从山崖涌出)为水之源头,因此在①、②、③、④语义,一些词习惯上可“元”、“原”通用,但在⑤、⑥、⑦语义中只用“元”。
可见,汉语“元语言”的“元”是义项③,与“元科学”(metascience)(科学之科学)可类比,即“语言之语言”。在“元语言”与“metalanguage”中,汉语义项③与英语义项③相对应。进一步思考则发现东西方对“元”的认知差异。meta的含义(在其后)源于“在对象之后”,而汉语的“元”的含义(起初)则源于“先于对象存在”。
根据以上的比对,计算机科学“基元”(基本单元)的“元”,含义是“单元”或“要素”,相当于“词元”、“义元”的“元”。如果元语言研究中引入“基元”,似乎应定义为“基本/词元”。如果“释义/基元//词”是指用于语文词典释义的最低限量基本词元,那么“释义//基元词/集合”的特点就是工具性(基元具有元语言功能)、规约性(基元经过程序筛选)、定量性(基元数量有限)。“词典通常释义词语”的属性则是工具性、随机性、非定量性。二者的显著区别就在于是否采用统计、筛选和限量等手段进行优化。
四
2002年9月初,华林带着XH text扫描文本回到金陵。以华林为主,参与文本校对的有我的几位硕士生和博士生。
下旬,我赴港访问。与华林电子邮件往来,继续就开题报告和XH电子文本的制作交换意见。10月31日,收到华林的开题初稿《现代汉语释义元语言和词汇元语言系统研究》,1—3章《序篇》(研究概述);4—6章《上篇》(释义词项的计量分析和释义词元的提取);7—10章《下篇》(词汇元语言的研究方法和系统建构)。针对篇章结构显得松散,我建议不分篇,1—3章合并为一,第四章《XH电子文本的制作》和第7章《现汉词汇元语言研究的基础》可纳入相关章节,由此合并为6章。需要理清思路是,到底何为研究重点及如何研究。
在逐字逐句审读并批红的基础上,连夜另撰《关于安华林开题报告的修改建议》:
“现代汉语元语言系统研究”是李葆嘉提出的一个总项目,需要分成几个前后连续的子项目逐步完成。经过不断思考和调整,该博士论文只能在有限时间内完成其中的一两个子项目。
汉语元语言研究的前提或前期工作,关于元语言理论的相关问题已经明确。虽然论文撰写过程中务必进一步阐释和深化,但开题报告中只要扼要叙述。论文的重点是所进行的实际研究,开题报告的核心应对之深入思考和周密论证,以显示所做研究的切实可操作性,给评议报告的专家留下深刻印象。
1.既然研究范围限定为词汇元语言,题目则建议相应明确为《现代汉语词汇元语言研究》,而更名副其实的是《释义性词语的统计分析和词汇元语言的比对提取》。
2.建议研究步骤分为两步:释义性词语的统计分析和词汇元语言的比对提取。
3.建议释义性词语的统计分析程序是:建立XH电子库——析出XH释义句子——切分释义词语——统计释义词语——划分释义词语等级。
4.建议词汇元语言的比对提取程序是:以XH释义词语的最常用级词表为基础——参照对外汉语教学词表、儿童语言习得词表、小学语文教育词表、现汉词频统计表、词典所附基本词表等进行比对——借助优选法得出现汉元语言词表。
以上任务已十分繁重,时间紧且可能碰到棘手难题。能进行到哪一步,很难说。如能按时、高质完成,已堪称优秀博士论文。当然,理想的最终成果是,在现汉元语言词表的基础上进一步思考义场建构(难度相当大),同时将词元分门别类,最终建构“现汉词汇元言语系统”。但是否有时间和精力完成义场建构和分门别类,未知。以上任务完成后,才有可能进入释义和析义元语言研究阶段,通过典型分析、注释验证、模型优选等程序以建构系统。因此释义和析义元语言问题,不必在该文涉及。
建议字数控制在8000字左右,另缩写为1500字简本以便陈述。开题报告务必逐字斟酌,思考问题力求细致深入,行文风格务必简明流畅。
以上只是建议,仅供参考。重要的问题在于,发挥自己的创造潜力。
李葆嘉 谨识 10月31日
11月15日,华林发来了修改过的开题报告。题目改成了《现代汉语词汇元语言研究》,章目录压缩如下:
第一章 元语言研究概述(约0.6万字)
第二章 词汇元语言研究思路(约1万字)
第三章 XH释义词的统计分析(约2万字)
第四章 词汇元语言比对提取(约2万字)
第五章 理论价值和应用前景(约0.5万字)
附录:各种图表及数据(约4万字)
在研究步骤和研究程序部分,明确了分两步走:第一步,XH释义性词语的统计分析;第二步,词汇元语言的比对提取。初步考虑选择《同义词词林》、《现代汉语频率词典》、《汉语水平词汇和汉字等级大纲》、《汉语方言词汇》和中小学语文教学词表作为比对资料。同时明确了人机结合的方法、定性与定量结合的方法、比对法和优选法等主要研究方法。
12月4日,华林来信,说有老师提出“词汇元语言”似乎讲不通,同时怀疑这么短的时间内能否做完。当晚,给华林回了一封邮件:
华林:
我的看法已见《汉语元语言系统研究的理论建构及应用价值》一文:
虽然元语言这一概念来自逻辑学,但是将元语言界定为对象语言的解释性符号是确定无疑的。语言学的元语言包含三层含义:用于语言交际的最低限量的日常词汇,用于辞书编纂和词语释义的释义元语言,用于语义特征分析的析义元语言。之所以人们所掌握的最低限量的词汇也可以看作一种元语言,是因为最低限量的词汇是其他词汇的基础(其他词语一般都是这些词语的派生和变异,需要依据这些词语来理解其他派生性和变异性词语,因此具有元属性)。这一最低限量词汇与释义元语言天然具有共通之处。最低限量的词汇侧重于交际功能,可以作为语言学习所需最低词汇量的依据(是以后语言能力发展的基础和解释新学语词的基础,因此具有元属性);而释义元语言侧重于阐释功能,可以作为词典释义最低词量的依据。随着交际范围的扩展,最低限量的词汇可能不断调整,而释义元语言必须满足这一语言中所有词语的解释功能,因此具有稳定的规模。释义元语言是最低限量的词汇的优化系统。
结论就是,只要使用这一语言符号解释另一语言符号,这一语言符号就获得元语言性质。也就意味着,从理论上说,任何词语都具有潜在的“元”属性,只要它被作为讨论或者解释对象语言的工具性语言在使用。
以上看法,仅供参考。对于选题存在某些相左的看法是正常的,只要总体思路可行,有些问题还要在研究中逐步解决。至于在这么短的时间内是否可以做完,如果做不完,可以考虑舍弃第四章《现代汉语词汇元语言的比对提取》。这么一来,论题就要改成《现代汉语释义性词语的统计分析》了,否则名不副实。只要能够做好,还是具有相当价值的。
李葆嘉 谨奉 12月4日
接下来的思考中,我将词汇元语言视为个体语言的内核,提出元语言建构的“内核模型”。之所以一些同仁容易在“词汇元语言”问题上踌躇,除了需要补充相应的元语言知识背景,问题在于没有认识到词汇元语言(这里专指儿童在5岁以前所掌握的词元)是日后个体语言的发展基础,也可以说是理解以后接触的其他陌生或复杂词语的语义基础,因此具有“元”性质。最近看到对魏尔兹比卡研究的介绍后,才发觉我所提出的“内核模型”相当于她提出的“语义启动”或“微型语言”。因此,华林依据几种通行词表的交集得出的词表不是严格意义上的“词汇元语言”。为明确其性质,我在12月20日的信中使用了“受限词汇”这一术语,2003年4月26日的信中建议改称“受限词汇系统”,主要作为元语言释义的验证对象。
开题报告前三天,我又给华林去信。
华林学弟:
开题报告不必紧张,一是你的开题报告准备得比较充分,一是基础工作已顺利进展。好的选题不但具有新颖性、科学性、可行性,而且是理论性、描写性和应用性的结合,更应当具有前瞻性、整合性和可延伸性。对专家们可能提出的问题,你要有一个预先设想。
举办开题报告的主旨,我以为,一是对选题价值和可操作性的认定,一是提出建设性意见。对于专家提出的意见,应多听、多记、少解释。具有启发性的意见,应立即接受。存在分歧性的意见,留待思考。总之,应当避免一来一往的反复辩解。因为,这毕竟是开题报告,而不是成果鉴定。应当创造一个相互探讨、和睦融洽的氛围。
盼注意劳逸结合。
李葆嘉 谨奉12月17日
这一期间,华林和其他研究生仍然在紧张地校对XH text文本,曲维光也已进入软件编制的状态。我建议试做一两个文本的分词和统计后,再扩展到全部文本。
李老师:
我已经开始进行软件的编制,同安老师进行了交流。请放心,我会尽努力完成恩师的嘱托。
曲维光 11月15日
葆嘉恩师:
我刚从桂林开人工智能会议回来。拜读大作,犹如钱塘观潮。我与安老师已商量好,下周一见面检验软件的功能。如他满意,我再将他的批评指正发给您。您手下的同学们都在热火朝天地工作,希望我的工作能使恩师满意。
曲维光 12月6日
三天后,维光发来A开头的XH text文本的处理文件。一周以后,我在给华林的信中谈到:
华林学弟:
曲维光做好的部分分词文件已发给我。维光为人真诚,办事负责,具有强烈的敬业和协作精神。XH二校已完成的大部分,请先发过来。王晓斌、汤玲可不参加,唐萍则根据她本人的意愿。至于于红、章婷、封鹏程,必须继续协助校对。我读研期间,同学之间相处和睦,情同手足,你们能够友好相处,甚感欣慰。除了同门,与同专业、同宿舍、同院系的研究生都应如此。对文学院老师、办公室行政人员也应充分尊重。
来港两个半月,承担了浸大中文系首开课程《国学要籍阅读》,并做了一些讲座。除了上课,必须不断看书,不断思考,不断研究,不断写作,不断修改。回头一看,已成文稿十余篇。其中,尤以《明清西洋传教士官话课本研究》、《现代汉语词语搭配与义征提取》和《人工语言脑:自然语言处理装置的研制思路》为精心所作。
这段时间,一直反复思考的是两方面:一是微观分析,集中表现在义征的提取和语义兼容性;一是宏观思路,集中表现在自然语言处理装置以及机译工具的研制思路。《自然语言处理装置的研制思路》草成后,12月9日将“机译系统研制流程图”发给陈小荷教授征求意见。同时在信中写道:昨晚我上了董振东先生的“知网”。研制者界定义原为“最基本的、不易于再分割的意义的最小单位”,并认为义素和义原没有区别,两者等价,都是指语义的最小单位。我的初步感觉是:似乎缺少结构语义学的基本知识,义素(我称之为“义征”)是人工化的用来标注词语的语义特征,即析义元语言的基本单位。“义征”相当于语音分析中的区别性特征,是对自然语言“义位”的人工性解构,而并非“最基本的、不易于再分割的意义的最小单位”。另外,知网“义原”相当于我在释义元语言中确定的基本单位“释义元”(释义性词元),并未上升到析义元语言系统中的基本单位“义征”(“析义元”)的深度。因此,义原≠义素,两者不等价。在机译工具研制遇到障碍的情况下,应当转向的领域是语义认知网络。
陈小荷教授在回信中说:“9号来信中提到语义分析问题,我亦有同感。董振东的义原并非义素,兄指出这一点真是一针见血。他的‘知网’,我下载有2000年版的原始文本及界面,2002年最新版估计不会有太大变化。知网提供的语义信息还不够丰富,特别是在词语这一块,分析深度尚嫌不足。我以前曾涉足这个问题,知道做起来很不容易。没有一个大的理论框架,具体工作不好开展,因此就放下来了。现在要做跨语言的信息提取,不得不涉及语义分析。但是究竟该怎么做,如何才有实效,弟尚在踌躇。”
南京冷下来了,可香港没有冬天。我在这里一切顺利。学校有办公室,宿舍在半山,环境怡人,没有干扰。虽然做事要抓紧,但你仍要注意劳逸结合、调整身心。
预祝开题顺利并有所受益!
李葆嘉 谨奉 12月15日
12月中旬的香港,处处弥漫着迎接圣诞的祥和气氛。17、18两天,华林发来了XH text二校文本。20日开题报告,华林当晚发来邮件,我在括号内加按语连夜回复:
李老师:
下午如期举行了开题报告会。每个老师都提了很多意见,有些意见甚至很尖锐。意见主要集中在这样几个问题:
1.元语言理论跟“释义词的统计分析”和“词汇元语言的比对提取”有什么关系?就是说,不用元语言理论同样可以做这样的工作。根本问题在于理论和实践的衔接问题。(李按:没有元语言理论背景或不在这一理论下进行操作,也就不可能做。如果可能做,这些年来谁做了?之所以没做,就是因为没有建构元语言理论。计量词汇学,如果没有元语言理论,也就是词汇计量,不可能形成提取限定数量的释义元语言的研究思路。释义元语言和词汇元语言,都在元语言研究范围之内。)
2.释义词的统计分析和词表的比对提取怎样相容?两者不是一个系统,怎样结合在一起?(李按:依据释义词的统计,可以根据不同需要选取不同频度的释义词。基于其他词表的比对提取出来的是日常基础词汇表,或我以往称之为的词汇元语言。两者处于不同层面。我们的任务是利用优化过的限量释义词表,作为受限词汇的释义工具。今补:魏尔兹比卡的一个基本原则是“还原释义”,即用有限的简单词语解释开放的复杂词语。这一方法类似于化学中的还原分析法和代数学中的还原求解法,其目标是把语义解释或分析用语还原为数量最少、解释力最强、适用性最广的一组词。)
3.提取的词汇元语言词表有何理论价值和应用价值?(李按:迄今为止,汉语的词汇系统尚未建构,根本问题在于词汇的开放性和语义的复杂性。词汇元语言即我所提出的“内核模型”中的研究对象。如果内核模型中的词汇系统能够建构成功,整个词汇系统就可望逐步建构,因为其他词语只是这些词元的派生和变异。)
4.词汇元语言和基本词是什么关系?(李按:基本词是传统词汇学术语,是一个内涵和外延从未明确界定过的经验性术语。词汇元语言的理论背景是元语言学,依据一定程序提取的词汇元语言具有定性和定量特征。)
对老师们提出的问题我没有一一回答,只说了自己的一些想法。我这个人有话直说,从来不隐瞒。我再三告诫自己,但一听到尖锐的问题,情绪就上来了。没办法,辜负了您的谆谆告诫。(李按:人多习以为常,先入为主;缺少相应的知识背景,习惯于以老术语套新思路,则难以提出切题的建议,但可以引发进一步的思考。)
安华林 12月20日
新年到来之际,华林仍在继续校对最后的几个text文本。
华林:
校对记录表和新年祝福、补发的文件,皆已收到,谢谢!听说你的开题报告是87分,很可以了。
封鹏程来信说:“晚上安师兄请我们几个师妹师弟吃饭。席间,很轻松,很融洽,很愉快。”此消息堪慰。你虽与他们同学,但也是他们的老师。你多费心了。
香港近来的气温在10—16度,我在这里一切皆好。南京冬天很冷,望注意保暖。
李葆嘉 谨奉 2003年1月4日
2003年1月10日,XH的text文本二校终于全部做完,下面的工作就是分词和校对了。
李老师:
您好!XH二校终于全部做完了,准备明天找曲维光全面分词。再补发T、W、X三个文件,至此已全部发完。您看看全不全?我准备12日回去。寒假期间集中做分词校对。他们都忙,假期联系也不方便,我自己先做吧。
华林上 1月10日
自动分词存在许多问题,校对起来相当麻烦。
李老师:
我于元月12日返回信阳,除了必要的应酬和杂务,天天主要是忙校对。现在才校了300多页,速度上不去,急也没办法。
华林 1月26日
春节期间,华林又来信告知分词校对和词表共核词提取的进度。
李老师:
XH分词校对已近600页,计划3月底完成,4月底完成《XH释义词语的统计与分析》初稿(与曲维光合作,毕业论文的一部分)。
华林 2月18日
华林:
请你指导一下章婷、封鹏程如何使用音标粘贴,他们目前输入《汉语的祖先》的两篇文章需要加国际音标。抓紧研究的同时,务必多注意身体。
祝与曲维光合作顺利!
李葆嘉 谨奉 2月18日
2003年春,华林在《江苏社会科学》2002年第4期上发表的元语言研究现状论文有了反响:
李老师:
紧赶慢赶,XH分词校对还有一个多文件,估计在三四天内可以校完。尽管还有一些地方不甚满意,但已没有时间和精力去深究。不过这些问题并不影响现在的目标。
经您指导写的《现代汉语元语言研究现状概述》已有些反响。《高等学校文科学术文摘》2003年第1期摘要如下:笔者在梳理对元语言概念的不同理解的基础上,从辞书释义元语言、语言教学元语言、语义分析元语言、信息处理元语言四方面概述现代汉语元语言的研究现状,同时指出当务之急是建构语言学的元语言理论,以推动汉语言元语言系统的研究和中国元语言学的建设。
3月底上海有个吴方言国际学术会议,余志鸿先生邀我参加。尽管我对吴语一窍不通,但想开开眼界,所以就答应去了。
华林 3月18日
华林学弟:
吴方言国际学术会议,赞同你出席。一是多接触学术界同仁,一是读博期间需要出席会议。与会费用在项目经费中报销。4月中旬,邵敬敏教授在暨南大学组织汉语语法会,本想让你和洪淼都来出席,但我联系太迟。
巢湖会议上,许宝华先生已邀出席吴方言会议,我说其时在港难以到会。姚德怀先生刚邀我在香港语文学会演讲。我出席了第二次吴方言国际学术会议(2001年苏州),也是我第一次出席汉语方言学会议。这次与会,如遇胡明扬、谢自立、王福堂、钱曾怡、李如龙、张振兴、张惠英诸前辈,请代为问好。
正如瞿先生所言,你是很用功和勤奋的。做项目费精神力气,抓紧但务必张弛有度。学术反响会随项目进展逐步出现。万事开头难,基础建立起来,会有一系列延伸项目。分词校对完成后,请将文本发过来。
本月下旬我将到深圳大学交流,4月中旬去暨南大学,5月中旬出席香港城大研讨会。5月底如期返宁。
春天为多发病季节,注意保重。
李葆嘉 谨奉 3月18日
4月下旬,华林发来与维光合作的论文《XH释义词语的计量研究》。读完全文后,提出以下建议:
第一,XH释义词语的“计量研究”范围太大,可以说是系列论文选题。建议就该文所研究的内容命题。既然主要成果是“XH释义用词词表”,建议使用更明确的“释义性词语”这一术语,即题为《XH释义性词语的统计与分级研究》。
第二,来文中“根据词频,把XH释义词分为三类(常用、不常用、非常用)六级”。据我的看法,“常用”反映词汇的内部结构,“频度”反映词语的出现几率,这一问题可暂不纠缠。但既然依据频度统计,最好使用高频、次高频、中频、低频、罕频“五度词频区分法”。与之相应,《XH释义用一级词和二级词表》建议改为《XH释义性语料高频词表》。
第三,可将XH释义性词语统计与《现代汉语频率词典》的词语统计进行比较,重点比较前100个或200个。以之作为论文第四节“XH释义性词语统计的相关比较”。来文字数是8660字,删改增补可达1万多字。没有一定的量难以体现一定的质。
华林修改后发过来。我又修改完发过去。接到我修改的二稿后,华林5月8日回信:
修改二稿已经收到,改得细致入微,让学生深为感佩!每每读您为学生修改的文字,都让学生受益匪浅,感慨良多。我再仔细改改。
随着《〈现代汉语词典〉释义性词语的统计与分级》定稿,释义元语言研究的前期工作告一段落。该文后刊于《语言文字应用》2004年第1期。论文后附记:
本专题由项目主持人李葆嘉教授设计《XH语料库制作及释义词计量分析工作计划书》,安华林负责具体实施和计量分析研究,曲维光负责语料分词和统计程序设计及操作,于红、唐萍、汤玲、章婷、封鹏程、王晓斌协助语料库校对。
华林的不辞辛劳与维光以及诸生的通力协作,有了一个阶段性的总结。
倚青山而居,沐香江之风。往返于火炭、沙田和九龙塘之间,涌入匆匆上下班的人流。一切井井有条,到处一尘不染……在港的日子令人难忘。除浸会教学、其他研究、与华林诸生邮件往来,围绕“元语言研究”主要做了以下工作:
2002年11月22日,应浸会大学语文中心范国教授之邀,作《语义语法学理论和元语言系统研究》的演讲(刊《深圳大学学报》,2003年第2期)。
2003年1月10日,苏兄新春来香港城市大学短期访问,与之交谈元语言研究和词汇系统研究。
2003年3月29日,应深圳大学应用语言学研究所所长张卫东教授之邀,作《自然语言处理装置研制的新思路的》演讲。5月,修改稿提交香港城市大学主办的“第四届汉语词汇语义学研讨会”(网上研讨会)。
2003年4月10日,应邵敬敏教授之邀出席“新世纪第二届现代汉语语法国际研讨会”(暨南大学和香港大学主办),提交《汉语的词语搭配和义征的提取辨析》(刊《兰州大学学报》2003年第4期)。15日上午应暨大华文学院之邀,介绍语言科技系的建设思路和现状;下午应暨大文学院之邀,报告《语言科学与语言技术的新思维》。
《语义语法学理论和元语言系统研究》将语义语法学和元语言研究相互渗透,《汉语的词语搭配和义征的提取辨析》是对义征提取的微观研究,《自然语言处理装置研制的新思路》则立足于自然语言处理。自然语言处理装置的实质就是“人工语言脑”。这一研制工程可分解为:作为研制基础的“语言基因图谱分析工程”、作为研制关键的“认知语义网络建构工程”和作为研制目标的“受限语言能力模拟工程”。基于这一构思,建构元语言系统的过程也就是“语言基因图谱分析工程”。
五
2003年3月26日,张卫东教授再次邀我去深圳大学。28日返港时,处处是一片口罩,人人如惊弓之鸟。几天之内,SARS已从广州传至香港而走向国际。两天后,香港高校停课。我给家人和学生发出了预防SARS以及疫情预测的邮件。而此时,华林的博士论文开始动笔,遇到一些棘手问题,我对之逐一加按语然后回复。
李老师:
关于SARS您分析得很精辟!当前最重要的还是预防,保重身体为要。
我已动笔写毕业论文,计划在年底以前或提前完成初稿。学生虽然愚拙,但在您的指导下,相信不会写得太差。很长时间以来,我一直在思考的一些影响全局的问题却悬而未决,写作中常因犹豫而不知如何下笔。只好向您请教,以便理顺思路。
1.开题时定的题目是《现代汉语词汇元语言研究》,您对“词汇元语言”的界定是“日常交际的最低限量词汇”。我对交际的理解是包括口语和书面语两方面(李按:理论上,应以口语为准,即一个不识字的社会人所务必掌握的日常词量)。如果限于口语的话,我手里的材料不足,不足以代表口语的面貌,一些词表主要是书面语材料。(李按:此为受过普通教育者所掌握的日常词量)而且,这样界定和XH的统计分析挂不上钩(李按:XH的统计是释义词系统或释义元语言,不是词汇元语言)。根据统计材料,XH释义高频用词和几种词表的共用词差别很大,比如“爸爸”、“妈妈”XH就没有(李按:高频XH释义词不能够反映词汇系统)。我想,能不能把词汇元语言(称为“元语词”行不行?)定义为“现代汉语各种语域共用的高频词”?(李按:好像不是一回事。今复按:“各种语域共用的高频词”不好叫,一是供交集提取的词表包括基本词表、高频词表等;二是“各种语域共用”难验证。“词汇元语言”本质上应是儿童5岁以前掌握的词汇。提炼“词汇元语言”,当以儿童口语词表为主,辅以方言调查词表和对外汉语教学词表补充缺漏。在早期计划中,列出了这些词表。可能是由于不好找,华林利用了好找的一些词表。)把XH和几种词表合在一起比对,这样提取的结果是现代汉语词汇的核心,称为现代汉语元语词汇(今复按:次日建议称之“受限词汇系统”,详见下文)。理论上,讨论和常用词、基本词的异同,应用上,根据需要调整、扩展。这是一种思路。
2.参考您的看法,我把元语言从功能上分为释义元语言和析义元语言两大类,而它们的基础是日常交际的最低限量词汇。最低限量词汇、释义元语言和析义元语言是三个层级,只有前面研究好了,才能对后面进行深入研究。(李按:日常交际最低限量词汇得另外进行田野调查研究)学生愚见,最低限量词汇还不是元语言(李按:最低限量词汇大致相当于词汇元语言,是语言能力发展和解释其他词语的工具。今复按:词汇元语言和释义元语言一定要分为两个层级,否则势必在操作中陷入困惑),却是元语言的基础,可从词表的比对中提取。(今按:仅根据现有基本词表、教学词表、高频词表等提取出来的,不是纯粹的词汇元语言)研究释义元语言时以最低限量词汇为参照系,但不合并提取共用词。(今复按:释义元语言以XH高频释义词为基础,通过对词汇元语言的释义过程逐步补充,而不仅是借助其他词表补缺)题目叫《现代汉语释义元语言研究》(或叫《现代汉语最低限量词汇和释义元语言研究》),分最低限量词汇(李按:这个名称可另取)提取和释义元语言研究两步。这是另一种思路。
以上问题皆关乎全局,不确定下来便写不下去。学生无力解决,所以请老师指教。
华林 4月25日
次日,我又给华林发去《关于“现代汉语释义元语言研究”的建议》:
论文应依据材料修正基本术语和选题名称。
你最初的开题报告名称虽是《现代汉语释义元语言和词汇元语言系统研究》,但依据你的报告内容,我的建议是“既然研究范围限定为词汇元语言,题目建议相应明确为《现代汉语词汇元语言研究》,更明确的、名副其实的是《释义性词语的统计分析和词汇元语言的比对提取》”。
根据现在的情况,因为没有日常交际最低限量词汇的田野调查语料(以及儿童语言的语料),如果词汇元语言的比对提取(你原来的设想是依据现有几种词表)难以实施,论文选题可调整(或压缩与深化)为《现代汉语释义元语言研究》。
请参阅我的《语义语法学理论与元语言系统研究》(深圳大学学报2003年第2期),上面提及的“建立内核模型思路”和“受限语言系统理论”可供借鉴。
没有依据方言会话跟踪调查语料,“日常交际最低限量词汇”从哪儿来?因此,建议在论文中避免使用“最低限量词汇”这一术语,可使用“受限词汇系统”这一术语。至于如何“受限”,依据研究的需要再制定原则和进行选取。
问题的关键或者难点不在于统计和划界,而在于如何通过选择一定范围和一定数量的词语进行释义,以验证所提取的释义元语言词元可以满足日常词语的释义需求,没有缺漏和羡余。总而言之,本研究的重点在于使用释义元语言解释受限词汇系统。
选题名称改动以后,章节目录也要作相应改动。
李葆嘉 2003年4月26日谨识于香港
华林回复如下:
李老师:
您好!关于毕业论文和《XH释义性词语的统计与分级研究》的指导意见皆已收到。谢谢您的认真审改和悉心指教。XH一文修改后再烦您审阅。
参照您的建议,对毕业论文的框架和思路作了重新调整,发去请您批示。多谢老师!
华林 4月27日
调整过的《现代汉语释义元语言研究》(写作思路)的章目录如下:
绪论
第一章 元语言研究概述
第二章 现代汉语释义元语言的研究思路
第三章 XH释义性词语的统计与分级
第四章 现代汉语受限词汇的比对提取
第五章 现代汉语释义元语言系统的建构
第三节 释义元语言的验证(通过实例检验其释义的可行性和充足性)
第六章 现代汉语释义元语言系统的理论价值和应用价值
我在4月30日给华林的回复是“边研究、边撰写、边完善吧!”主要感觉是第五章中的第三节“释义元语言的验证”可能要独立为章。如果释义词的统计分析是研究前段,受限词汇的比对提取和释义元语言词元的建构是研究中段,那么释义验证就是最大的后段工作量。
六
2003年5月中旬,访问即将到期,接华林来信。
李老师:
您什么时候返宁?我现在还在信阳,两边学校都限制流动,不知怎样见您?
华林 5月18日
华林:
月初,香港SARS疫情已明显回落,口罩已纷纷摘下。至于内地,华北“沦陷”不必待言,江浙难免风声鹤唳。我于22日回宁,依据规定必须隔离。
目前,江苏仍限于到过北京的零星病例,不会形成传播峰。更何况如临大敌,步步设防。北京近日感染人数骤减,趋于回落,但河北、河南由于大批民工返乡,可能存在传播隐患,尚须处处小心为妙。
你既已回信阳,又何必到南京来隔离,就在家中做论文。务必赶前不落后,在10月底完成全稿。没有3个月的反反复复修改,质量无法保证。我近年来审阅过一些博士论文,深有此感。
估计江浙一带的疫情警戒在6月以后会逐步取消。
李葆嘉 谨奉 5月18日
5月22日,从红碪乘“专列”(整个车厢我一人)返回,次日达沪转车回宁。在苏州路寓所中独居。6月12日,接华林邮件。
听于红讲,您从香港回来消瘦了许多,请保重身体!《受限词汇词表》是《汉语词汇的统计与分析》(取前4000词)、《现代汉语频率词典》(生活口语4000词)、《汉语水平词汇与汉字等级大纲》(甲、乙级3051个词)、《现代汉语三千常用词表》、《普通话三千常用词表》五种词表比对的结果。因《现代汉语三千常用词表》按词形统计,所以比对时先按词形提取,然后再分化为词项。每一步在论文里都有说明。
《释义元语言1》单纯是《受限词汇词表》和《XH释义中、高频词表》的合并,采用的是并集方法,尚未加工处理。其中《XH释义的中、高频词表》的独有词只是词形,还没有分化为词项。目前正在作优化处理。
7月12日,华林又来信。
一个月前给您发的邮件,一直没有回信。今天查了一下,才知地址是hotmail,可能您没有收到,再次发去。一个月来,我对《释义元语言1》进行了几次调整,并用XH以A字母打头的词条的释义(大部分进行了重释)进行了验证。令学生苦恼的是,缺漏太多,补不胜补。下一步打算用调整后的词表对受限词汇词表的所有词项进行释义验证。学生的感受是,功夫花了不少,结果却不理想。真不知有什么好办法?用另一邮件给您发去调整后的词表。
我的复信如下:
华林:
邮件收到后就回了,没收到的原因可能是我的邮箱和163网络那段时间常出问题。
先要做的就是对受限词汇词表的所有词项进行释义验证(这一点我以前提过),以后再考虑逐步对更多的词汇进行释义(需要其他条件和研究成果的配合,论文内不必考虑)。因为前人没有做过,所以特别辛苦。但是不必着急。做一步是一步,一切都在于探索。
研究一段务必休息一段,要利用假期把家中的事情处理好。
李葆嘉 谨奉 7月14日
验证释义的道路无疑是曲折的,需要对释义对象逐一采用“试商法”,然后再基于多个“释义商”归纳为“释义元”,一步步填补缺漏。以往语言研究的最大问题是,提出理论框架的很少从事具体而微的研究,而从事具体研究的又东一榔西一棒。迄今为止,对语言系统的了解或浮光掠影,或支离破碎。一触及语义,一提出定量,其研究过程难免充满艰辛和迷惘。与套用西方框架、填充汉语材料的思维定势形成强烈反差,在语义领域内开拓,我主张以系统归纳法为主,典型优选法为辅。
苏新春在《元语言研究的三种理解及释义型元语言研究评述》(《江西师范大学学报》2003年第6期)中评介了张津等的国家自然科学基金重点项目的研究报告《从单语词典中获取定义原语方法的研究及现代汉语定义原语的获取》(1996)。这一研究的做法是基于汉语词典释义语料,通过数学模型计算释义词与被释词之间的语义关系,从而得出3856条“定义原语”。苏新春在文中指出其明显不足:1.以《同义词词林》作为义类标码参照系可以,但“定义原语”的有无以之作比较对象则大而无当。2.“定义原语”资格的可疑。3.“定义原语”中专有名词过多,名词总量高达2865条。最突出的是提取出来的“定义原语”信度不高,里面存在大量不可能承担释义功能的词。我以为,既然如此,就不是一个可为汉语词汇进行定义的应用系统。其原因除苏新春文中所揭示的“很大程度就在于提取方法的选择”,关键是没有去做非常辛苦的受限词汇的释义验证工作。撇开系统归纳法和典型优选法,企图仅借助数学模型和计算运行建构有效的“定义原语”系统的结果表明——此路不通。这一困惑和辛劳还在缠绕着当时的华林。
李老师:
今年夏季不是暴雨倾盆,便是酷热难当。即使假期,我想您也不会闲着,贵州和南昌会议都前往了吧?
目前已做完XH中以A开头的词条和受限词汇释义验证工作。感受还是缺漏太多。最新的词表发去请您过目,仍需优化。表中的冗余部分可以内部检测,最困难的是不知还缺什么,缺多少。只能是尽心而已。发去的新词表主要包括四个来源:1.受限词汇(带甲、乙标记的词);2.XH中高频词(除1的另外部分)和局部增补的词(黑色标明);3.验证A字母时增补的词(红色标明);4.验证受限词汇时增补的词(蓝色标明)。
华林 8月14日
夏去秋来,待华林返校时,受限词汇表和释义词元表已基本完成。需要继续的仍然是释义验证及其补充调整。作为“常委”(久住学校的博士生自称)之一,华林的研究一直延续到严冬。2003年12月10日,华林论文的一稿出来了,章目录如下:
绪论
第一章 元语言研究概述
第二章 释义性词语的统计分级
第三章 现代汉语受限词汇的比对提取
第四章 现代汉语释义元语言系统的建构(第四节 释义元语言的实例验证)
第五章 现代汉语释义元语言系统的理论价值和应用价值
附录一:现代汉语受限词汇词表
附录二:现代汉语释义元语言词表
附录三:本文简称一览表
我提出的主要建议是:1.第四章第四节独立,改为第五章“现代汉语释义元语言的验证”;2.验证中务必增加与《现代汉语词典》释义的比较,如果量大则将“验证”拆为两章;3.术语表、简称表、符号表附在绪论后,特别需要补充的是术语表,因为这是新的研究;4.第五章改为“释义元语言的优化”,另设“结论”纳入“理论和应用价值”。我修改的目录如下:
导论(附:术语表、简称表、符号表)
第一章 释义元语言研究的思路和方法
第二章 现代汉语释义性词语的计量研究
第三章 现代汉语受限词汇的选择
第四章 现代汉语释义元语言的提取
第五章 现代汉语释义元语言的验证
第六章 现代汉语释义元语言的优化
结论
12月20日,华林将稍加修改的论文二稿和目录交给我。寒假期间,华林继续在反复修改……每改一处都难免“牵一发而动全身”……2004年3月10日,华林博士论文三稿出来了,可谓洋洋大观。
除了前言和结论,验证部分不得不分为两章,杀青稿(3月17日)七章的目录是:
第一章 释义元语言研究的背景和思路
第二章 现代汉语释义性词语的计量研究
第三章 现代汉语受限词汇的选择
第四章 现代汉语释义元语言的提取
第五章 现代汉语释义元语言的验证
第六章 现代汉语释义元语言的验证(续)
第七章 现代汉语释义元语言的优化及体系建构
另据我的建议,在“技术路线”部分增加了流程图(下列是华林论文答辩后我改动的流程图):
现代汉语释义元语言研究流程图
如果要进一步展示研究思路,还可增加一份从基本预设(学术原点)到逐步推演,到最终结论的学术逻辑图。
4月下旬,面对华林的厚重成果,我写了如下论文评语和推荐参加答辩的意见:
学位论文《现代汉语释义元语言研究》具有重要的理论和应用价值。全文约30万字。在导师的指导下独立完成。作为新开拓的方向,无论是针对自然语言释义,还是面向语言信息处理,现代汉语元语言研究的价值非常明显。论文以语言学的元语言观为指导,坚持人工和机器、定性和定量、内省和验证相结合的方法,建构现代汉语释义元语言系统。首先,一方面对《现汉词典》中的释义用词进行计量分析,另一方面基于五种常用词表抽取共现词以建立受限词汇系统。其次,依据释义性高频词汇与受限性词汇的交集,提取释义元语言基本词。然后,通过增补、调整、验证和优化等手段,确定释义元语言的词元量。该研究成果不仅体现为行文阐述,而且集中表现为系列词表,可为词典编纂的释义选词和信息处理的词汇分析提供参考。
该研究隶属于国家社科基金项目“面向信息处理的现代汉语元语言系统研究”。通过几年努力终于有此成果,其中甘苦作者和读者皆可体会。该研究理论和方法在国际为首创,研究成果达到国内先进水平。
5月上旬,在复旦大学范晓教授的主持下,华林的博士论文顺利通过。作为论文评审专家,北京语言大学的赵金铭教授和上海师范大学的齐沪扬教授等都给予了很高评价。南京师大送外省专家的盲审评分也在90分以上。
七
“元语言”这一概念虽然肇始于西方逻辑研究,但是引进语言学领域,势必形成“逻辑学的元语言”和“语言学的元语言”的研究分野。就逻辑学的元语言而言,虽然在个别场合应用,但是逻辑学的元语言系统迄今未知全貌。自然语言的元语言(Natural Semantic Metalanguage)研究,魏尔兹比卡在20世纪70年代提出,其研究目标主要是为跨文化交际、普遍语法和语言类型学提供语义基础。
自然语言元语言理论的基本原则之一是“还原释义”(reductive paraphrase)。在语义解释和分析过程中,应尽量使用简单易懂的词对那些语义复杂的词进行描述。还原释义中不允许存在专门术语、新造词、逻辑符号或缩写词,而只限于使用自然语言中的简单词。自然语言元语言研究就是要把语义分析用语还原为数量最小、解释力最强、适用性最广的一组词。与之相应,“语义启动”(semantic prime)成为魏尔兹比卡元语言论中的核心概念。每一语言都有一个基本的、普遍的意义核心。在所有复杂表达都解释清楚以后,每种语言都有一个不可再还原的“语义核心”保留下来。正如魏尔兹比卡(1998)所言:
每种语言都有一个不可再还原的核心。通过这一核心,说话人可以理解所有复杂的思想和言语,而所有语言的各个不可再还原的核心具有对等性,因此所有语言的不可再还原的核心反映了不可再还原的人类思想。
这一“语义核心”相当于一种“微型语言”。多年来,魏尔兹比卡一直致力于发现和确定这些“原词”。在《语义原词》(Semantic Primitive,1972)中提出14个。80年代以来,原词数量扩增到60个左右,同时认为应该还存在着更多原词,需要做深入细致的调查才能确定。在《英语言语行为动词:语义词典》(English Speech Act Verbs:A Semantic Dictionary,1987)中,魏尔兹比卡用60个原词对229个英语言语行为动词进行了释义。我的博士生,江西师范大学外国语学院钟守满教授的国家社科基金课题就是《英汉言语行为动词的语义认知结构》。
毫无疑问,人们在日常生活中使用着两套语言——“表达语言”和“元语言”,尽管人们难以觉察。就二者关系而言,如果前者是编码语言,而后者则是解码语言;如果前者作为对象语言,而后者则成为工具语言。从个体语言的发生学立场来看,自然语言是在5岁以前学会的。我们现在能够回忆起的早年往事(我的方言中称“记事”),一般都不超过5岁之前。换而言之,长期记事必须依赖于语言,“记事”能力是在语言掌握到一定程度以后才具有的。因此,我们不妨这样考虑,表达语言是我们“记事”后使用的扩展语言,而元语言是我们“记事”前掌握的基础语言,即个体语言大系统中的小系统或“内核”。从呱呱落地到呀呀学语,随着神经发育的成熟和认知能力的发展,个体逐步掌握了这一“元语言内核”。这一过程可以视为“激活”,激活先天语言认知能力而建构成个体语言系统;这一过程也可视为“建构”,个体语言系统的后天建构而展示出先天语言认知能力。
我所创建的元语言理论和方法的主要特点是:1.区分逻辑学的元语言和语言学的元语言(“语言学的元语言”相当于魏尔兹比卡的“自然语言的元语言”);2.提出元语言研究和语言研究的内核模型(相当于魏尔兹比卡的“语义启动”);3.提出元语言系统的层级性(其“认知元语言系统”相当于魏尔兹比卡的“跨文化原词系统”)及其特点;4.提出元语言的逐层抽象建构法和各层元语言系统研究的技术路线;5.提出元语言研究和语言研究的受限方法;6.提出元语言理论和语义语法学的相互渗透;7.从自然语言处理的立场出发,提出“语言基因图谱分析工程”和“语义网络建构工程”,将析义元语言研究视同“语言基因图谱分析工程”。与魏尔兹比卡的元语言论明显不同之处是:1.提出元语言系统的层级性和逐层抽象建构法,认为基于几种语言的元语言系统才能建构人类的普遍认知元语言系统;2.把元语言研究和自然语言处理结合起来,在语言信息工程的平台上建构元语言系统和语义语法学体系;3.提出基本词元或“语义原词”也可以进行义征描写。4.内核模型或“语义启动”的数量不是几十个,预计是1000个左右的义位组成的认知语义网络。
2004年10月和12月,先后应江西师范大学、南昌大学之邀,应四川外语学院王寅教授的特别邀约出席当代语言学第九次研讨会,就“语义语法学与元语言理论”做专题演讲。在引起语言学界同仁反响和关注的同时,每演讲一次都有新的触动和受益。
八
作为新开拓的领域,元语言研究任重而道远,目前我们正在继续进行以下研究。
一、词汇元语言的继续建构
除已有对外汉语教学词表、现代汉语高频词表和华林完成的《现代汉语受限词表》等,现代汉语词汇元语言的继续建构还需要以下词表:1.儿童语言基本词表。5岁以前儿童的语言,除了搜寻以往研究成果,计划中的调查拟进行跟踪性录音,然后进行统计分析。2.日常话语基本词表。与华林的研究同期,唐萍选择了一个方言点,以一个家庭为场景进行了为期三个月的跟踪性录音。建立了首个现代汉语方言日常会话自然语料库(录音约100万汉字语料,选出其中的50万汉字语料),完成了词频统计分析。3.民族语言调查词表。在民族语言的田调中,民族语言学家积累了丰富的经验。中央民族大学李锦芳教授提供了《侗台语言调查提纲(词汇)》(3406个)。4.历史比较基本义项表。为论证亲属关系和推测语言年代,斯瓦迪士(20世纪50年代)先后制定了200词表和百词表,郑张尚芳(1995)草拟了《华澳语言比较三百核心词表》。历史基本义项表的拟订是系统工程,本质上是对史前某阶段语言文化要素的重建。在以上词表的基础上综合平衡,才有可能建构可信度高的词汇元语言系统。
二、释义元语言研究的深入
1.定义释义元语言词元义位。在华林提取的释义词元表基础上,有四项工作要做。一是词元义位的拆分。《朗文》释义词没有将非单义性释义词元进行分解。二是词元义位的补充。依据语义网络的对称性填补缺项。三是词元义位的分类。基于析义元语言成果,进行义场化分类。四是词元义位的定义。对释义词元逐一定义,以保证释义过程中恪守单一义位。
2.进行英汉释义元语言对比。白丽芳的博士论文选题是《英汉语释义元语言的对比》,通过《朗文》2000释义词和华林释义词元的对比以揭示问题。钟守满的博士论文选题是《英汉语言行为动词的义征分析对比》。
3.研制释义元语言词典编撰工具。研制目标是编撰元语言释义词典和完善释义元语言词元系统。这一软件工具预计上半年研制出来,其功能是利用现有释义词元编写释义词条,如需补充的释义词元则会储存到释义元语言系统中去,并能记录释义词元的使用次数。
4.编撰现汉元语言释义词典。借助并逐步改进以上工具,第一步编撰小型词典,释义对象是3000个受限词汇。第二步编撰中型词典,释义对象是10000—15000个学生语文词汇。第三步编撰大型词典,释义对象是40000个成人语文词汇。由此形成不同语文等级的释义元语言集合,尽管核心词元或者“语义启动”相同。
三、析义元语言研究的展开
析义元语言研究就是建构现代汉语义征标记集。这一工作从去年下半年启动,目前正在研究的专题有:名词的义征研究(于红博士论文)、亲属称谓的义征研究(郑尔宁硕士论文)、手部动词的义征研究(延俊荣国家博士后基金项目)、日常动词的义征研究(李瑞硕士论文)、心理形容词的义征研究(赵家新博士论文)、类别词的义征研究(华滢硕士论文)、副词的义征研究(史宁宁硕士论文)、功能词的义征研究(黄进博士论文)。
四、认知元语言研究的酝酿
认知元语言研究,目前可以在做一些前期工作。我的几位外国留学生,学位论文的选题是《泰语释义元语言研究》(韦丽娟硕士论文)、《韩语释义元语言研究》(玄可美硕士论文)以及《非洲布鲁语基本词汇研究》(艾力博士论文)。在今年招收的研究生中,预计确定的选题有《〈说文解字〉元语言研究》和《英语析义元语言研究》。
我的师生观是“亦师亦友”,我的教学法是“教学相长”。在元语言的继续研究中,我希望华林仍然能够参与合作。陆俭明先生不久前来南京师大,赞赏元语言理论提得好,对之研究寄于希望。没有元语言理论,语义研究找不到合适的切入口,难以摆脱支离破碎。在同仁的共同努力下,可以预期,当今国际自然语言的元语言研究,除了波兰学派和莫斯科学派,还应当加上新崛起的中国南京学派。
九
华林是瞿霭堂先生的高足,硕士论文研究河南固始方言,先后执教过“现代汉语”和“语言学概论”等课程,这些都为进一步从事语言研究夯实了基础。瞿先生是我景仰的前辈,2001年深秋,余兄志鸿陪同瞿先生来宁相聚。次年2月14日,瞿先生赐书。
去年南京一晤,由于时间未能畅谈,没有达到论学问道的目的,非常遗憾。先生的学科非常前卫,是语言学发展的方向。南方的语言学科引领中国的新潮流应指日可待。华林是一个用功和勤奋的学生,可以说心无旁鹜,志在所学,以求有所作为。只是长处偏僻之地,少见识而疏于思,在先生指导下,必将有所进步,成就学业。
序而赞曰:
固始安君,负笈南都,三年探索,学业有成。心无旁鹜,志在所学,瞿师所言,深有同感。故乐而为之冗序,而九节旨在探索无穷。
华林《后记》中强调“探索,探索,再探索”,我愿引而与之共勉。
2005年元月18日于南都
作者简介
图书目录
相关推荐
-
图书 现代汉语自主状语研究
作者:赖慧玲
图书 现代汉语自主状语研究
-
2
图书 现代汉语处所宾语研究
作者:单宝顺
图书 现代汉语处所宾语研究
-
3
图书 现代汉语存在句研究
作者:张先亮 范晓
图书 现代汉语存在句研究
-
4
图书 现代汉语确信副词研究
作者:张则顺
图书 现代汉语确信副词研究
-
5
图书 现代汉语警告范畴研究
作者:刘晨阳
图书 现代汉语警告范畴研究
-
6
图书 现代汉语黏合结构研究
作者:应学凤
图书 现代汉语黏合结构研究
-
7
图书 现代汉语与现代汉诗关系研究
作者:朱恒
图书 现代汉语与现代汉诗关系研究
-
8
图书 现代汉语“是”字强调句研究
作者:何文彬
图书 现代汉语“是”字强调句研究
-
9
图书 现代汉语频度副词研究
作者:关黑拽
图书 现代汉语频度副词研究
-
10
图书 现代汉语语用否定研究
作者:王志英
图书 现代汉语语用否定研究
豆瓣评论