当前位置: 首页> 职业导航> 正文

融媒辞书的理论方法与实践演化

admin 2025-07-22 183


融媒辞书的理论方法与实践演化

章宜华

提要:从20世纪80年代电子词典出现,到2019年中国辞书学会提出融媒辞书概念,辞书界认识到,辞书从“多媒体”到“融媒体”的演化,不只是“媒体”量的增加,而是涉及媒体与模态之间和模态与模态之间的融合机制等问题;媒体形式的融合应促进模态内容的融合,释义和注释内容的融合才是融媒辞书的核心。模态是被释义词的指称通过认知感官反映在人们大脑中的心理映像,意义在多模态语境中更易于理解。融媒辞书应根据语词释义的需要,把相关的媒介、媒体、模态融合为一体,使之共同参与语义的表征过程,成为重要的释义元素。本文意在厘清融媒辞书的核心内涵、融合要素、融合路径、模态元素和理论基础,将融媒辞书编纂的文本特征概括为:两极化、数据化、模态化、平台化、网络化;并结合实例,从融媒辞书的制作资源、知识文本和数字技术3个方面来考察现有数字词典的融媒特征如何实现及其状况。

关键词:融媒词典学;融媒辞书;辞书电子化;辞书数字化;辞书融媒特征

融媒辞书是数字化辞书的一种信息组织和出版形式,融媒体是辞书和语言知识的一种外在表现,辞书的知识内容仍然是辞书的核心内容。那么,为什么要凸显这种表现形式,把它命名为“融媒辞书”呢?为什么不是“多媒体辞书”或“全媒体辞书”呢?国际辞书界从20世纪80年代就开始出版的各种电子化和数字化辞书与融媒辞书又有什么关系呢?弄清这些问题,有助于我们认清当前的辞书出版现状,更好地发展融媒辞书。

为说明这些问题,需要从电子辞书的发展历史和演化阶段来分析辞书与计算机、电子化和数字化之间的关系,并从理论和实践上来解释它们的演化过程和阶段特征。


一、辞书电子化与多媒体的演化

(一)辞书编纂的计算机辅助与电子化

自从有了计算机,人们就不断尝试用机器来辅助辞书编纂中的文字处理工作。20世纪60年代,美国学者就利用当时第一个百万词级的布朗语料库(BrownCorpus)为《美国传统词典》(AmericanHeritageDictionary)统计单词频率,根据每个词的语境分布确定其语域和含义。80年代中期,随着完全依据语料库编写的COBUILD词典的出版,学界开始了计算机词典学的研究,当时主要聚焦于面向自然语言处理的机器词典、计算机辅助词典编纂、纸质词典电子化和电子词典的出版等问题。一些信息技术公司走在词典电子化的前列。日本和联邦德国分别在1981和1983年推出CASIOTR-2000和Alpha8英德/德英芯片电子词典,微软的电子版词典(MicrosoftBookshelf)于1991年问世,接着西方的一些辞书机构开始把词典做成光盘版和网络版。这个时期的电子词典与纸质词典的区别是词目词配置了“真实”读音,后来又逐渐增加了释义词句和例句的朗读。1988年的《词典学》(Lexicographica)年刊推出了“计算词典学和计算语言学”专题,博古拉耶夫和布里斯科在1989年出版了《自然语言处理中的计算词典学》(BoguraevBriscoe1989)一书,集中体现了当时词典学的现代化发展状况。90年代中期,中国辞书界开始了电子词典和多媒体词典的研究(麦志强1994;章宜华,黄建华1996;刘臻1998),总结出多媒体的特点是配置丰富的读音和插图。21世纪初期,电子词典、多媒体词典已经成为研究热点,国际主流学习词典引入了丰富的多媒体功能,其特点是用户界面的友好性、交互性、多样性、方便性(章宜华2004,2013)。可以说,这个时期辞书界已开始把多媒体看作电子词典的重要特点。

(二)数字化技术发展与多媒体演化

电子词典的第一阶段,主要是纸质词典的电子化,只是用合成读音取代了注音,图片仍保留了纸质词典的静态特征。由于技术限制,信息传输的都是模拟信号,即利用传感器(如视听)把各种自然现象以连续信号“临摹”下来,并转换成相应的电信号进行传播。模拟信号容易处理,但抗干扰能力弱、保密性差,辞书的版权难以得到保证。因此,这一阶段国内主流辞书出版社都不愿意涉足电子词典的开发,当时国内较为流通的《即时通词典》《朗道电脑字典》《汉神电子词典》《地球村》《金山词霸》等,多为信息技术型公司所开发。进入21世纪,数字化慢慢被引入词典编纂的各个阶段。所谓数字化,就是用A/D转化器把传感器感知到的模拟量转换为数字量,即将复杂多变的信息转变为可以度量的数字,并依据适当的数字化模型进行编码和传播。数字信号可表示和传输任何信息,且可通过加密提升辞书版权的安全性。欧美信息公司利用数字技术建立了大型的词典门户(如YourDictionary,OnelookDictionary,1000Dictionaries),品牌辞书出版商也把数字出版作为其主要发展目标(如《牛津英语大词典》2010年宣布今后只出数字版)。这个时期的电子词典结构更加灵活,功能更加丰富。《计算词典学》(章宜华2013:222~231)通过对国内外几十种电子词典的分析,发现有15类、80余种相互联系的功能,包括多媒体功能、人机互动学习功能,如查询方面有即指即查、单击捕获、图片取词等屏幕取词方式;多媒体方面有图片和动画显示、键控词目发音、窗口即指发音、整句整段朗读、语音、声音浏览等;自主学习方面有单/双语写作助手、错误校正助手、录音对比练习、拼写/听写练习、生词测验、综合训练、单词卡片,以及分类显示等。可见,多媒体技术随着数字化的深入逐渐完善,辞书的多媒体功能在那时就已经十分成熟了。2016年,在《国家信息化发展战略纲要》号召下,国内数字化辞书的建设显著加快了节奏,主流辞书出版社纷纷加入词典移动应用程序(APP)的开发。


二、多媒体技术与融媒辞书的演化

在多媒体辞书进入成熟期后,数字辞书的发展出现了一个引人注意的现象:不是在释义和注释内容及其形式上下功夫,而是在媒体技术上不断推出“新点子”,竭尽办法开发辞书的辅助或外围功能;或者把许多种类的辞书聚集在一起,以门户网站的形式集中推送给用户。但这些只是媒体量的增加和词条/释义的大量重复,在给用户提供些许方便的同时也造成信息的大量“过载”,反而会对词典查阅造成选择或理解困难。解决这些问题的最佳方法是发展“融媒辞书”。

(一)融媒辞书的核心内涵

“融媒体”一词起源于20世纪70年代末的传媒界,80年代初步形成了“媒体融合”(mediaconvergence)的概念。不久普尔(Pool1983)又提出了“传播形态融合”(convergenceofmodes),认为融合使不同形态传播媒介之间的界限趋于模糊,形成多功能一体化的媒介形态。英语的mode或modality就是“模态”的意思,但普尔只是把融合的对象“mode”限制在文本、声音和图像等逻辑媒体,所以这里译作“形态”。随着媒体融合的研究和发展,mode的内涵被逐渐揭示出来——实际就是多模态。事实上,融媒体一直就是围绕“融合”和“模态”这个轴线在发展,融媒体辞书的核心内涵就是“融合”与“融通”(章宜华2022)。融媒辞书的形态结构、设计和编纂理念相对于传统辞书都有很大变化。这些变化首先反映在辞书的表征形式和媒介上,而外在变化又反过来要求辞书的编写内容、表征元素及其信息组织方法做出相应改变(章宜华2021b)。也就是说,形式的融合促进了内容的融合,释义和注释内容的融合才是融媒辞书的核心。

(二)融媒辞书的融合要素

既然“融合”是融媒辞书的核心内涵,那么首先就须搞清融合的对象或要素。广义上讲,“媒体融合”涉及一切媒介及其相关要素的汇聚、组合和融合,它通过促进横向整合,重新定义行业界限,包括信息生产主体、信息内容,以及传播方式和介质等(McPhillipsMerlo2008)。这与词典项目的运行环节完全吻合:(1)信息生产主体——词典编纂团队或机构;(2)信息内容——词典文本内容;(3)传播方式和媒介——出版方式和发行渠道。媒体融合‒融通的对象或要素就包含在这3个环节中(见图1)。


从词典学角度讲,这几个方面可以构成完整、系统的理论框架,便于明确融媒辞书的理论方法和任务;从技术角度讲,融媒体信息的呈现方式对于我们获取和处理信息会产生很大影响,它将词典信息与传播、教育、学习、工作和社会活动联系起来,远远超出了传统词典的范畴(章宜华2021b)。生产主体是辞书信息生成的基础,信息内容和传播方式则是融媒辞书设计、编纂和出版各个环节都需要考虑的问题。

(三)辞书媒体融合的主要路径

如上所述,融媒辞书的“融合”直观地反映在知识信息的逻辑媒体和物理媒体(章宜华2019)上,但实质上是落实在心理模态上。那么,模态与媒体又是什么关系呢?简单地讲,模态是被释义词的指称通过感官反映在人们大脑中的心理映像,而媒体则是模态外在表达和传输的载体。具体地讲,人们靠眼耳鼻舌身等认知模态(感官)来感知客观事物,反映在大脑中的是语言的语音、形态、语法、句法、语义、语用和使用场景等,这就是心理模态;这些心理表征需要由语言、文字、声音和各种结构形式等逻辑媒介表示出来,最后又通过电子信号、磁盘、光盘等来存载,通过各种媒体终端(平板、手机、电脑等)以数字信号的形式送达词典用户,这是物理媒体。大家知道,“多媒体”一般指图片、声音与文字的组合,而在数字时代,仅停留在媒介层面词典无法描述词义的各种细微表达效果,也无法适应新媒体表达方式极度细化的需要;只有深入到模态的层面,才能全面、细致、准确地描述语言文字的各种细微表征。所以融媒辞书涉及模态与逻辑媒体和物理媒体的交互融合,模态才是核心内容。因此,“多媒体”“全媒体”这两个词语无法反映融媒辞书的全部内在特征。


(四)辞书媒体融合的模态元素

在数字经济时代,各种信息海量呈现,生活节奏空前加快,人们在单位时间内获取更多信息量的需求愈益迫切。多元识读教学法(NewLondonGroup1996)的兴起也说明单一模态的信息传播方式难以满足时代的要求(章宜华2021b)。因为单一模态学习有其认知局限性,正如胡壮麟(2007)所说,以读写为主的传统识读能力在多媒体时代已不够用。实际上,人们在交际时对语义的构建和传递原本就是多模态的(胡壮麟,董佳2006),意义在多模态语境中会变得有趣、生动,易于为人所理解。所以,在语言学习(特别是二语学习)中要重视多模态的应用和融合,让用户在解读释义时能接受到多种模态的并行或交互刺激,激发用户各种心智模态的转换、共同作用于用户的认知思维。

Bernsen(2008)从计算机人工智能的角度建立了一套模态理论,这里参照该理论构架,结合数字辞书的特点,拟从以下两个方面构建模态元素。

(1)语言模态:静/动态真实语音(口语或符号)、静/动态拟真读音、静态真实图形(书面文本、图或符号)、动态真实图形(动态书面文本、图或符号,静/动态口语/符号);动态拟真图形(静/动态手势话语/符号)、静/动态真实触觉(触觉符号、动态操作)、静/动态真实视触觉;等等。

(2)自然/拟真模态:静态图形(图像、图表、视觉隐喻),动态图形(图像‒脸部表情、手势、肢体动作、行为,图表、视觉隐喻、知识动态),静/动态声音(动物、器具、现象、行为等),静/动态触觉(图形、结构、感应),静/动态视触觉,静态拟真图形元素(图形、图像、图表、视觉隐喻),等等。

融合就发生在这些元素之间。融媒机制则是根据语词释义的需要,把相关的媒介、媒体、模态融合为一体,使之共同参与语义的表征过程,成为重要的释义元素,而不是像传统词典那样,多媒体元素只是释义或词典知识信息的补充或附加成分。

(五)媒体‒模态融合的理论基础

构建辞书的多模态释义系统必须依据特定的理论方法,如多模态符号学、符号语法和知识可视化理论等。多模态符号学(multimodalsemiotics)指社会符号学视角下的多模态理论学说,主张把构建意义的所有符号资源都纳入语言研究范围,包括口语、书面语、图像、图表、音乐、色彩、动态影像等模态,任何语篇的意义都是由多重符号模态表达的(KressvanLeeuwen1996;李战子2003;Kress2010;李战子,陆丹云2012)。

符号语法(semioticgrammar)是研究和构建多模态符号系统的基本方法。各类符号既有表义的共性,又有不同的表现形式和系统规则,譬如视觉符号和听觉符号都有各自的表现形式和构成方法,人们可以像对待语言符号一样分别从概念、人际和语篇功能3个层面来分析各种模态符号的变异功能和相互语义关系(KressvanLeeuwen1996;vanLeeuwen1999;李战子,陆丹云2012)。知识可视化是在科学计算可视化、数据可视化、信息可视化基础上发展起来的,旨在用视觉表征促进群体知识的传播和创新(EpplerBurkard2004)。可视化表征形式有概念图、思维导图、认知地图、思维地图、矩阵图、流程图、示意图,以及词汇‒语义网络等。

可见,从“多媒体”到“融媒体”辞书的演化,不只是“媒体”量的增加,而是涉及媒体与模态之间和模态与模态之间的融合机制等问题,必须有系统的理论和方法做支撑。形式各异的符号可以表示各种各样的模态。对于特定融媒辞书项目,可以根据辞书的编纂宗旨和用户的实际需求,在上述模态融合的理论框架下来分解其多模态元素,设计系统的融合方法,以便对被释义词不同模态的语义进行清晰、细腻的描述。有关融媒辞书媒体融合的特征与方法、多模态辞书文本的特征与数据结构,以及融媒辞书的数据编制,已有另文专门讨论(章宜华2019,2021a,2021b,2022),这里不再赘述。下面仅概括地阐述融媒辞书编纂的文本特征。


三、融媒辞书编纂的文本特征

在形态上,融媒‒多模态辞书无法像纸质词典那样呈现明确、固定的文本结构,因为各种模态的编码、存储和表述方式是不一样的,且词条信息内容复杂、信息量巨大,利用平面直观的方式排列是不现实的。另外,数字化辞书的载体、传播和查阅方式都发生了变化,辞书形态也是处于动态变化中的。融媒辞书的文本可以概括出以下5个特征。

(一)两极化:指普通用户与学习者用户、普通用户与专门用户的两极。一般来讲,融媒辞书的潜在用户是全部网民,这种辞书要大型化、综合化,不再分专业和门类,收词起点要在百万以上,向覆盖广、收词全、义项详尽、知识丰富的方向发展,能满足各类用户的需要。面向学习者的辞书,其任务和问题针对性强,收词要少而精,义项少而详,释义要多模态化;而面向专门用户的辞书,收词只限制在特定专业和用途中。

(二)数据化:辞书的大型化和综合化使得辞书条目越来越复杂、篇幅越来越长,而辞书用户群的泛化和需求的多样化要求辞书提供的信息必须具有用户针对性,否则辞书就会失去其使用价值。为此,辞书信息项必须要极度细分或碎片化,并按数据库(字段、记录和表)结构组织和存储各种相关的多模态数据,详细标注各信息项的属性、语域、专业及其显示度,以便用户按需提取。

(三)模态化:图形和声音等媒介是一个笼统的概念,不能很好地描写融媒辞书中极度细化的信息内容,需要从模态的视角来区分由视觉、听觉和(视)触觉等所感知的各种表达模式,譬如,仅非语言视觉符号就包括动/静态色彩、图形、图像、结构、动作、行为、事件,以及表情、眼神、手势、姿势等肢体语言;此外,还有真实与拟真的区分。当单个模态融合为多模态时,所表达的内容就更加丰富了。

(四)平台化:需要建立专门的数字融媒处理平台,利用平台实现辞书编写的范畴化、模块化或模式化。即对不同范畴类型的条目设计出不同的辞书编写模板,统一编写体例和格式,各模板中的信息项须做模块化设计,编者可按需增减。此外,平台可以把分散在各地的编者聚集在一起,主编在平台上分配和检查任务,编者可在任意时间通过各自的数据编辑终端按统一模式进行辞书编写。

(五)网络化:自然语言的词汇间有着复杂的形态、句法、共现和语义关联,词典为排序的需要把这种网络关系打乱了,这会直接影响或阻断用户的知识联想。融媒词典可运用数据化信息结构和自动索引技术在数据库中重构语言的自然关联,包括同范畴关系、同/反义关系、上/下义关系、共现关系、同族关系、同缀关系、同形关系和同音关系等,为用户提供足够的联想认知语境。


四、现有数字词典的融媒特征实现考察

根据项目研究的需要,我们从搜集到的2000多种词典APP中抽取了200多种进行重点分析,结合国内外研究发现:国外辞书界并没有明确的“融媒词典”的概念,更没“融媒词典学”的研究;但自2010年开始,就出现了多模态词典学(Lew2010),同时国内也开始探讨双语词典的多模态趋势(党军2010),或多模态电子词典的功能(罗永胜2015;钱亦斐2016)。“融媒辞书”是中国辞书学会于2019年应数字出版发展需要提出来的创新概念,与这一概念相关的论文已经发表10多篇,其中部分文章虽然提出了“融媒”概念,但仍沿用传统词典的叙事方法,也有结合特定词典的编写提出的“融媒操作”的思考(王兴隆,亢世勇2021;杨玉玲2022);还有部分是对现有数字词典的“融媒特征”评价,指出了现有词典APP存在的“融媒”问题(唐舒航2021;解竹2021)。主流辞书出版社也先后推出一批数字化辞书(见表1)。下面结合实例从融媒辞书的制作资源、知识文本和数字技术3个方面来考察现有数字词典的融媒特征如何实现及其发展现状。


(一)辞书制作资源的融媒特征

如上所述,融媒辞书项目从策划到出版的各个环节都是跨多种学科的运作,传统的项目策划理念已经无法满足融媒辞书制作的需要。因此,需要从辞书人才资源、辞书语言资源和辞书数据资源3个方面进行整合。

1.通过融媒平台汇聚分散在各处的相关辞书编纂力量。例如《JUZI汉语》项目,其编纂团队依托“商务”和“北语”两大中心,通过美国明德学院(MiddleburyCollege)中文暑校这个中介,整合了北京语言大学、澳门大学、耶鲁大学、麻省理工学院、西雅图华盛顿大学和ACC项目(美国各大学联合汉语中心)等机构的国际中文教育优秀师资力量,加上商务印书馆数字出版中心的专业辞书编辑和数字技术力量,组成了40多人的适应融媒辞书出版需要的编纂和编辑队伍,这是保证该项目成功的关键。

2.融媒辞书不单收词量要大,还要融合专业词汇和各种表征模态,传统的小型、专业语料库难以胜任。这需要广泛搜集网络资源建立大型多模态语料库,或者将多种小型或专业语料库整合起来使用。在这方面,专业信息公司比较有优势,如谷歌、百度、网易和腾讯等在10多年前就开始网络大数据的搜集和运用,先后推出了基于语言大数据的词典和机器翻译平台。《JUZI汉语》也使用了“九州语言网”“BCC语料库”“CCL语料库”和“汉语国际教育动态语料库”,实现了例句的丰富性、真实性和实用性。此外,“HSK动态作文语料库”还被用来判定词语的常见偏误,编写偏误预警。这充分说明语言资源的整合对融媒辞书编纂的重要性。

3.融媒辞书的一大优势是能充分利用出版社的存量辞书数据,即设计专门的数字处理平台,把各辞书条目录入库中,通过软件程序对各辞书的数据进行比较、筛选和过滤,按统一的数据结构提取元数据作为融媒辞书编纂的数据资源。现在,主要是以词典门户的形式出现,如国外的《牛津在线》《剑桥在线》和OneLook,国内的《涵芬》《聚典》《JUZI汉语》等,都各自将多部同类词典聚合在同一界面分别进行查询,但还未有做必要的融合处理。这会造成信息冗余,在某种程度上增加用户负担。

(二)辞书知识文本的融媒特征

融媒辞书要在规模或收词数量上做到用户友好,条目内容要综合化,不再区分专业类别。辞书的释义或解释要多模态化,辞书信息的组织要结构化和数据化,以提升辞书的使用效果。

1.融媒辞书要面向所有网络或新媒体终端用户,因此大型化和综合化是其首选。不同专业、不同语言的小型辞书先“结集”上线,后逐步做融合处理。例如,欧美辞书出版社就是先把超大型辞书推上网络,然后才是小型辞书组合成的门户网站。如牛津大学出版社的《牛津英语大词典》于2000年初上线,而牛津英语类和双语类整合成两大词典门户多年后才面世。其他如MultiLanguageDictionary聚合了180种语言;LanguageLiveDictionary收录170多部词典,但都是单独检索的;Onelook共有1246部词典,查询窗口将全部词典融合在一起,输入一个检索词即可显示所有包含此词的词典的释义,但基本都仍未做条目的融合。

3.由于信息传播形态和人们办公阅读习惯的改变,用户的词典需求明显向着多样化、碎片化方向发展(李宇明,王东海2020;章宜华2021b)。要满足碎片化的查阅需求,必须要对词典的微观信息进行数据化处理。但从考察的情况来看,现有词典APP的查询显示大多是静态文字和图形,极少有词典的文本信息允许“碎片化”的操作查询。可以说,大部分在线词典只是纸质词典的电子化,无动态信息,难以适应媒体融合的需要。也有部分词典做了整体结构化处理,但在具体操作上还无法实现按需显示,如《JUZI汉语》采用了XML文件格式,词条信息项的结构化程度比较高,虽未提供碎片化或定制索引,但只有部分信息可分类显示。

(三)辞书数字技术的融媒特征

数字通信技术是模态‒媒体融合及其跨媒体传输的保证。融媒辞书的核心是用数字技术把词典文本的各种模态像化学反应一样融为一体,共同表征语义及其用法,且能跨媒体或全媒体传播。

1.融媒辞书中各种释义模态首先要与相应的逻辑媒介相融合,以文字、语音、声音、图形、图表、色彩、结构、动图、动画、影像等交互形式,通过数字化模型转化成数字代码后进行分类存储。融媒辞书不存在固定、连贯的词条形态,但条目信息可以根据用户的需要进行动态组合,使多种模态能同时参与特定的解释。现有数字词典还未实现这种功能,但部分词典的显示已做分类,如《有道》(PC版)区分了释义、例句、用法板块,释义又分网络、专业和英英释义,例句分为双语、原声和权威例句,用法分为词典短语、同近义词、同根词和词源等;《JUZI汉语》主界面也可分类显示,包括解释、同义、任务和例句等。但这两部词典的图形与文本混排在一起,无动态融合。

3.融媒辞书的微观结构信息在结构化处理以后,各类信息原则上都可以“碎片化”调取。查询和显示界面针对用户可能查阅的各类信息项设置功能链接,指向数据库中相应的信息单元,用户可以根据自己的偏好或需要选择和设置查询项目,并能通过不同手段进行检索。但目前未发现有数字辞书能在索引项目上自由定制组合,或按需要碎片化调取相关内容,但索引方式有很大改进,如Findout–VisualEncyclopedia可通过拍物寻词;LiveBook–ScanningDictionary可以扫描纸媒查询;《聚典》可以屏幕取词查检;《涵芬》可查字词、成语、古汉语、诗词、谚语等,还能按拼音、部首、笔画等进行字词索引;此外,智能查询助手可通过人机互动获取辨析字词、近/反义词等。


五、结语

(参考文献略)

(本文首次发表在《语言战略研究》2024年第3期)


同类文章
  • 最新文章
  • 热门文章
  • 随机阅读
友情链接