译学观点|肖维青 熊凌崧:翻译测试研究二十年:现状与展望

发布者:冯瑜发布时间:2023-11-23浏览次数:96

提要: 本文借助R语言library(bibliometrix)包和COOC14. 1软件,可视化梳理了2003—2022年中外核心期刊(CSSCI、SSCI 和 A&HCI)发表的翻译测试论文,重点分析了测试构念、受试人员、测试题型和评分模型等研究内容。未来翻译测试领域须深化翻译测试本体研究,推动受试人员认知心理实证研究,制定面向市场的专业性翻译测试标准,探索符际翻译和语内翻译测试方案,加强机器参与和远程翻译教学与测试研究。

关键词: 翻译测试; 翻译能力; 译者能力; 翻译教学



1. 引言

翻译测试是对受试者翻译能力的测量(肖维青 2012a:27),贯穿翻译人才培养的全过程。作为翻译教育研究不可或缺的组成部分(张威,吕煜 2003),翻译测试被广泛应用于外语课堂教学和大规模外语等级考试,对翻译教学与外语教学具有重要实践指导价值。然而,翻译测试研究起步较晚,成果分布较为零散,系统性的文献爬梳和综述缺乏。本文对2003—2022年二十年间中外核心期刊的翻译测试研究论文进行总结和评述,兼顾教学翻译与翻译教学的测试研究,梳理研究脉络,揭示发展趋势。笔者拟探讨以下问题:(1)二十年来,中外翻译测试研究在发文趋势和主题方面整体呈现哪些特点? (2)中外翻译测试研究的主要内容是什么? (3)中外翻译测试研究存在哪些问题? 未来发展趋势如何?



2. 研究设计

笔者使用R语言library(bibliometrix)包的biblioshiny工具(Aria & Cuccurullo 2017:965)和COOC14. 1(学术点滴,文献计量 2023)软件计量分析文献数据,绘制可视化图谱,并结合文献阅读梳理翻译测试领域的研究脉络和发展趋势。


外文数据来源为Web of Science的SSCI和A&HCI数据库。文献检索以“translation testing/assessment/competence”、“translator competence”为主题词,两者之间为OR的检索逻辑,精炼类别为“Linguistics or Language Linguistics”,文献类型为论文,语种为英语。中文数据来源为CSSCI数据库,文献检索以“翻译测试、翻译能力、笔译测试、翻译考试、译者能力”等为主题词,检索逻辑为“或”。检索区间均设为2003—2022年,获得英文文献647篇、中文文献506篇(数据最后提取时间为2023年7月4日),经去重和剔除无关文献(会议报道、新闻、广告等),最终获得英文文献256篇、中文文献387篇。限于篇幅,本文重点关注笔译测试研究。



3. 翻译测试研究的可视化分析


3.1 发文趋势分析

基于年发文量数据,我们绘制了2003—2022年中外核心期刊翻译测试领域发文量趋势图(见图 1)。国内外翻译测试领域发文量均大体呈增长趋势。

国外翻译测试研究在2008年迎来第一次高潮,年发文量达到11篇。次年, Angelelli & Jacobson(2009)主编的口笔译测试与评估主题论文集引起了翻译测试领域的热议,此后几年发文量呈现平稳发展态势。随着机器辅助测试、专业化翻译人才队伍建设的需求日益增长,2015年后发文量多次出现高点,其中2019年达到35篇。


国内翻译测试研究在2003—2005年间发文总量仅为个位数。2006年发文量为11篇,2008年达到15篇的小高峰,2011年进一步上升到28篇,这一阶段成为国内翻译测试研究的快速发展期。之后几年(除2014年和2022年)发文量均在20篇以上,其中2015—2021年成为翻译测试研究的稳步发展期。国内翻译测试研究的发文量趋势在一定程度上说明,全国翻译专业资格(水平)考试(CATTI)从无到有、全面铺开,翻译本科专业(BTI)和翻译硕士专业学位(MTI)相继设立,翻译博士专业学位(DTI)呼之欲出,翻译专业教育、翻译职业化不断推进,有力推动了翻译测试研究开展。


3.2 主题分析

基于文献作者关键词(author's keywords)数据,我们调用R语言 library( bibliometrix)包的biblioshiny 工具绘制国外翻译测试研究主题图。图2显示,国外翻译测试领域讨论的主题可分为四类:基本主题(basic theme)、发展势头较高的主题(motor theme)、小众主题(niche theme)、新兴或衰退主题(emerging or declining theme)。基本主题主要包括译者培训/ 教育、翻译/ 译者能力、跨文化能力、就业能力、翻译过程研究、基于语料库的翻译研究、机器翻译、法律翻译、测试信效度等。发展势头较高的主题主要为评估,尤其是翻译质量评估。小众主题主要包括字幕、口述影像、视听翻译教学。新兴或夕阳主题包括翻译能力习得、翻译问题、翻译策略与自我效能感。翻译测试研究主题图凸显了国外翻译测试学界对翻译能力构念内涵和培养过程评估的重视,也反映了法律翻译、视听翻译等细分领域研究的必要性。

图片


由于R语言biblioshiny工具尚不支持中文文献数据分析,我们采用COOC主题演化加权算法,将截取关键词频次设置为3,制作国内翻译测试领域主题演化加权时区图(见图 3)。

图3中每个圆圈代表一个关键词,箭头连接关键词,对应横轴为分析数据集内关键词首次出现年份,后续出现频次加权计入,频次越高,圆圈越大。穆雷和蓝红军(2011)曾指出,翻译测试研究受到对翻译能力认识和语言测试技术的限制,因此深化翻译测试本体和技术研究有其现实必要性。自2012年起,每年均有学者开展“实证研究”,讨论翻译测试的“效度”和“构念”问题。随着“翻译测试”、“翻译资格考试”、“翻译能力”等核心概念不断被提及,国内翻译学界开始从将翻译作为外语教学的检测工具,转向开展翻译测试的本体研究。近年来,“中国英语能力等级量表”成为热点主题之一,学界尝试制定量表框架,以实证量化手段开展测试研究。关键词“机器翻译”、“译后编辑”、“翻译技术”频现,表明数智时代翻译测试注重译者甄别机器翻译质量并修正改进译文的能力。此外,“译者能力”和“国家翻译能力”的提出反映了“翻译能力”研究对象从文本转向译者,从学生译者、职业译者延展至国家翻译能力。



4. 翻译测试研究的主要内容


基于文献可视化梳理,过去二十年翻译测试研究的特征可总结为四点:构念不断精确化,主体呈现差异化,方法逐渐多元化,验证持续技术化。由此,笔者从以下四个方面归纳翻译测试研究的主要内容:一是翻译测试的构念,即译者能力;二是翻译测试的主体,即受试人员;三是翻译测试的方法,即测试题型;四是翻译测试的验证,即评分模型。


4.1 翻译测试构念:译者能力

翻译测试研究的构念指测试考查的译者翻译能力。目前,学界主要提出了专有唯一型(exclusive)与兼容并包型(inclusive)两种翻译能力模型理念。前者的代表人物如Pym(2003)提出了翻译能力的“最简方案”(minimalist approach),即译者生成多种译文并从中选择最优译文的能力。多数学者则对翻译能力持多成分观点,即采用兼容并包型能力模型,主要有PACTE(Process in the Acquisition of Translation Competence and Evaluation) 模型、Göpferich模型、EMT(European Master's in Translation) 能力框架和TICQ(Translation and Interpreting Competence Questionnaire)能力问卷。西班牙巴塞罗那自治大学翻译系Beeby等学者于1998年提出PACTE模型,认为译者能力的构成元素包括双语次能力、超语言次能力、翻译知识次能力、工具次能力、策略次能力和心理生理因素(PACTE 2003:59),并不断对其修正完善。与PACTE模型相比,Göpferich模型并未强调翻译专业知识,而是增加了“翻译流程激活能力”(Göpferich & Jääskeläinen 2009:169)。EMT 能力框架2009版以翻译服务提供能力为中心,周围圆环分别代表语言能力、跨文化能力、信息挖掘能力、技术能力和主题能力;2017版将能力合并重组,分为语言与文化能力、翻译能力、技术能力、个人与人际能力、服务提供能力,五大能力相辅相成、权重各异,一改旧版能力框架中服务提供能力的中心地位(邢杰,金力 2020:46);2022版仍沿用五大能力构成,但将服务提供能力的子项第35条修改单列为“通过行业协会、活动、社交媒体与其他译者、语言服务提供商建立联系,提升个人或集体的职业曝光率”,凸显译者的社交属性。TICQ能力问卷将笔译能力的考查分解为准备阶段、翻译阶段、策略研究、质量管理四个方面(Schaeffer et al. 2020:94),比其他模型更注重翻译测试的过程性。


目前国内学者对译者能力的解读多基于PACTE模型,其中翻译策略次能力可进一步细分为主题确定、认知框架建构、潜义明示、选词择义和衔接连贯等子能力(薄振杰,李和庆 2011)。也有学者指出PACTE模型的不足。比如,仝亚辉(2010)认为PACTE模型下含的次能力无法涵盖所有翻译能力,考察翻译过程的方法缺乏历时性,未能清晰划分翻译能力习得的各个阶段。因此,李家春(2013)在PACTE模型的基础上添加了现代技术次能力和就业次能力,更加符合当代译者翻译能力发展的实际需要。刘晓峰和马会娟(2020)认为译者能力研究应重视离文本较远的译者社会性因素,重构现有的译者能力培养模式。上述研究均为质性研究。


国内外译者能力研究的共同点体现在翻译测试的语言方向上,国内外均更多探讨语际翻译能力,却因实践市场需求等因素较少关注语内翻译和符际翻译能力。在国内外译者能力研究的重心差异上,国外学者多采用宏观视角,强调翻译的职业性,以交际语言能力模型作为理论基础;国内学者多采用微观视角,强调翻译能力在教学过程中的培养,翻译能力测试题材多为文学翻译(肖维青 2012b:111)。国内译者能力研究多为理论框架探索,对能力阶段性习得重视不够,量化实证研究不足,而国外研究偏向采用量化实证方法。


4.2 受试人员

从翻译测试的受试人员类别来看,国外学者多对翻译职业从业者和外语教师开展研究,而国内学者多以学习英语的非英语专业学生和英语专业学生为受试人员。


以PACTE翻译能力模型为例,西班牙巴塞罗那自治大学翻译系团队持续对其分项能力开展实证研究。表1的受试人员基本信息显示,国外翻译测试研究侧重强调翻译的职业性。


国内翻译测试研究的受试人员多为高校英语专业学生和非英语专业学生(如江进林,文秋芳 2012;徐鹰,叶美琳 2020)。相关研究主要从翻译测试效度、机器评分模型和评分策略方面展开,体现出国内学界对教学翻译成效检验的偏向。


4.3 测试题型

国内外翻译能力测试多采用文本翻译题型。Ahmadi(2011)通过实证研究证实了译文单选题不能替代开放式的文本翻译题型。Brooks & Brau(2017)调查发现,源语阅读理解测试、目的语写作测试对笔译员的遴选确有帮助,但不能仅仅依赖这两种题型来评判译者能力。目前,国内译者能力测试采取纸笔形式或不可查阅网络资源、不使用翻译软件的机考形式,关注译者的源语理解和译入语表达,缺少对计算机辅助翻译软件使用熟练度、译者信息素养的考查,与翻译工作实际存在一定程度的脱钩。在测试题型开发方面,穆雷等(2017)致力于全国翻译专业八级考试(汉英)设计,为其他语种翻译测试研发提供了参考。


译员职业道德素养体现译者的社会性,是译者能力不可或缺的要素。近年来,不少学者探讨了译员职业道德培养的重要性,呼吁翻译测试内容应包含翻译职业伦理(如Drugan & Megone 2011)。澳大利亚国家口笔译资格认证局推出的“National Accreditation Authority for Translators and Interpreters”(NAATI)考试将职业道德和跨文化沟通能力作为考试认证的基础。职业道德考试共45题,含10道陈述与道德原则匹配题、20道原则应用单选题和15道道德困境情景单选题。英国高级翻译文凭 ( Diploma in Translation, DipTrans )、 美国翻译协会(American Translators Association,ATA)考试、加拿大翻译工作者委员会(Canadian Translators, Terminologists and Interpreters Council,CTTIC)考试,以及中国的全国翻译专业资格(水平) 考试、翻译硕士考试等都仅关注篇章语言转换,缺少考查译者职业道德素养的题型。


4.4 评分模型

针对翻译过程中译者表现出来的翻译能力、最终呈现的翻译作品制定不同评分模型,也是翻译测试研究的重要组成部分。在评分策略研究方面,王金铨和文秋芳(2009)结合语义内容和语言形式,分别针对语义单位和语言的准确性、规范性制定汉英翻译分析性评分细则,并通过评分实践证明其具有较高信度。为减少评分员的主观因素, Khanmohammad & Osanloo(2009)基于对已有翻译评分标准的梳理和对41名翻译教师关于学生翻译方法选择的问卷调查,制定了评分标准和框架,具体由准确性(30%)、对等(25%)、语域和目的语文化(20%)、语法和源语风格(15%)以及转换、省略、增补和创造对等语(10%)组成,增强了翻译评分的客观性。肖维青(2012c)经过教学实验、评分实测和评分员跟踪访谈,指出综合使用机械扣分法、印象法和分析法是信度较高的翻译测试评分策略。徐鹰和叶美琳(2020)从认知心理学角度,采用问卷统计、有声思维法探讨CET4翻译评分策略,总结出评分员在评分过程中会采取修改、诊断、自我评估、推测和比较等评分策略。韩潮另辟蹊径,在口译测试、手语翻译测试中使用“比较判断法”(comparative judgement),又与他人合作在笔译测试中尝试此方法,提升测试的信效度(Han et al. 2022)。


在评分实现方式方面,随着计算机技术的发展,翻译自动评分成为前沿话题之一。实证研究表明,语料对齐的数目与翻译分数显著性相关,因此语料对齐技术相关参数可作为翻译评分模型的重要参数(文秋芳等 2009)。田艳(2011)从词语匹配、词语语义相似度和句式模板匹配角度,论述了网上英译汉自动评分的可行性。江进林和文秋芳(2012)通过建立英译汉学生译文机器评分系统,实现大规模测试的自动评分,实验预测效果反馈良好。Ke & Ma(2014)使用自然语言处理技术提取句子语言特征,建立基于语义的翻译自动评分系统,能够较好地模拟人工评分。近年来,也有学者开始研究汉译英试题自动评分。王金铨和朱周晔(2017)在翻译和英语作文自动评分系统研究的基础上,借助多文体、多比例训练集,通过多次随机分组构建了汉译英自动评分系统。



5. 翻译测试研究的问题与展望


基于中外核心期刊的载文数据分析和研究内容的微观探究,笔者尝试阐明翻译测试研究领域存在的问题,并展望研究的未来发展。


5.1 深化翻译测试本体研究

与翻译教育的其他组成部分相比,翻译测试研究整体规模不大,考察概念、实体、属性、关系等元素的本体研究还不够深入,需构建一个严格定义、可重复应用的结构化本体。翻译测试的本体研究主要包括可以预测翻译能力的测试类型和评分的信效度。从测试构念和受试人员上看,翻译能力研究已从学生译者和职业译者拓展到国家翻译能力层面,未来翻译能力的主体包括个人、高校、城市甚至国家。北京外国语大学发布的2021年全球国家翻译能力指数和中国大学翻译能力指数便是一种宏大叙事背景下的特殊翻译测试。从测试题型上看,需加强翻译伦理考查。CATTI杯全国翻译大赛已纳入基于情境的翻译伦理考查题型,值得服务教学和人才筛选的翻译测试借鉴。除了常规文本转换题型外,还可将反映译者翻译过程的实践报告(李长栓 2021)、体现译者能力发展过程的学习档案(learning portfolio)(Galan-Manas 2016)、关注译文风格协同能力的“续译”题型(王初明 2018)作为测试译者翻译能力的载体。从评分模型上看,应探究翻译试题内部模块不同题型间的逻辑关系;以信效度检验为抓手,评估翻译测试或试卷的整体效果;系统检验翻译质量模块实际效果(翻译评价中的内容、形式因素等在实际应用中的效果或反馈);对比评价翻译测试或质量检验模式(如结果式、形成式、综合式);探讨翻译质量评价中的人为因素控制(评分员的一致性控制与评价)。


5.2 推动受试人员认知心理实证研究

虽然国内外均有学者对翻译从业者、外语教师、高校学生开展了翻译测试量化实证研究,但翻译测试研究大多为思辨性研究。已有学者使用有声思维等方法,探究评分员思维活动对翻译测试信效度的影响,然而少有学者关注译者心理过程对翻译测试的影响。未来翻译测试研究应借助心理语言学、神经语言学和认知翻译学的研究范式,建立多模态翻译能力测试框架,通过 fMRI、ERPs、眼动、键盘记录等行为记录方法,考察翻译过程中译者的认知资源分配、认知负荷、情绪调节等因素,探究这些心理生理因素对测试结果的影响。这一研究方向也呼应了 PACTE 模型中的心理生理因素模块,拓展了翻译测试研究和认知翻译学的外沿。例如,可将认知心理学研究手段应用于 MTI 复试、外交部翻译司遴选等测试场景,将各项认知心理参数作为翻译学习者学能测试和抗压能力评估的量化参考标准,进一步优化翻译测试设计。


5.3 制定面向市场的专业性翻译测试标准

目前,基于通用文本的翻译测试已有较为固定的模型,但专业性翻译测试研究仍在萌芽阶段。吴萍和崔启亮(2018)指出应改革 CATTI 考试内容,增加语言服务行业所需基础知识和技术能力的考查内容,增设法律、医药等垂直领域的测试大纲和题目。虽然王海萍(2019)基于“华政杯”全国法律翻译大赛数据构建了包含语篇能力、术语能力和工具能力的法律翻译能力多成分模型,但该模型仍局限于语言应用层面,未能探讨合格的法律译者需具备的非语言层面能力因素。因此,设计专业性翻译测试时,不能忽略译者的社会属性和专业属性,应思考如何考查专业垂直领域译者的语言外能力。在翻译市场需求多样化的趋势下,未来翻译测试研究应在加强多语种互译测试的基础上,制定面向市场的各领域专业性翻译测试标准,推动开发各垂直领域的翻译资格证书考试和翻译竞赛。这将对翻译教育和培训的培养方案、教学大纲、课程设置修订调整起到正向反拨作用,确保培养出符合市场需求的翻译人才,形成翻译产业的良性循环。学校和企业翻译人才选拔测试标准还应涵括翻译人才的学能,即译者翻译能力的发展潜力,以实现翻译行业的可持续发展。


5.4 探索符际翻译与语内翻译测试方案

尽管以通用语互译为代表的语际翻译占翻译市场的绝对份额,但符际翻译和语内翻译测试仍需学界重视。国内外已有学者对视听翻译的翻译过程和质量评估开展研究,但尚未对视听翻译中的译者能力提出清晰的定义及测试框架,服务视听障人士的无障碍翻译能力测试研究缺位。根据微信公众号(如 AnyTranz 译中人、译匠、英文笔译)和相关翻译工作交流群发布的译者招募信息,翻译市场有时也需要熟悉方言、少数民族语言和民族共同语的语内翻译人才。未来翻译测试研究应加快建立完善符际翻译和语内翻译的测试实施方案,其中符际翻译测试包含字幕翻译、口述影像、游戏本地化等,语内翻译测试包含方言与共同语翻译、古代语言与现代语言翻译等。


5.5 加强机器参与和远程翻译教学与测试研究

随着大数据、人工智能、神经网络技术日新月异的发展,机器不仅能作为“译者”产生译文,还能作为“评分员”参与人类译者翻译测试评分,节省人力和物力。因此,有必要对机器参与翻译全过程开展研究,从译者能力框架视角借助大样本训练来提升机器参与翻译的整体效果,实现机器自我测试和翻译能力迭代,减轻人类译者的工作负担。此外,近几年部分国外翻译硕士项目转为线上教学,翻译实践项目也转至线上,既让翻译教学和测试突破了物理空间限制,也对翻译从业者的工作模式造成了深远影响,给远程翻译教学与测试研究带来新的问题和挑战。未来翻译测试研究应结合远程翻译教学工具和翻译实践中的常用技术手段,探寻更符合市场需求的远程翻译服务从业培训和测试标准,为高校、培训机构、翻译服务提供商培养和使用译员提供准确可靠的评估理论框架和应用工具。



6. 结语


本文通过回顾2003—2022二十年间中外核心期刊发表的翻译测试论文,发现国内外翻译测试研究均呈现蓬勃发展的态势,但各有侧重。国内多将翻译测试用于辅助翻译教学,而国外更加侧重翻译职业能力测试,因此国内外翻译测试研究领域可互相借鉴。文章梳理了测试构念、受试人员、测试题型和评分模型等主要研究内容,指出国内外研究均体现了从关注“翻译能力”到注重“译者能力”的转向。结合时代背景和翻译市场需求,笔者建议未来翻译测试研究须深化本体研究,推动受试人员认知心理实证研究,制定面向市场的专业性翻译测试标准,探索符际翻译和语内翻译测试方案,加强机器参与和远程翻译教学与测试研究,从而促进翻译测试基础研究、应用探索和跨学科研究,推动翻译测试领域全面发展。



参考文献





作者简介


肖维青,上海外国语大学英语学院;熊凌崧,重庆市外事翻译中心。

文献来源|原载《外语界》2023年第4期。

推送已获作者授权,引用请以期刊版为准。