译学观点|宋炳辉:新技术语境下翻译文化研究何为?

发布者:冯瑜发布时间:2024-02-23浏览次数:11

在20世纪逼近尾声的时候,乔治·斯坦纳(George steiner,1929−2020)(2020:iii-iv)在他的代表作《巴别塔之后》第三版序言(1997)中,曾就机器翻译做出这样的判断:“对各种模式的机器翻译和机器辅助翻译的研究仍在继续。人们已经取得了一些‘ 贝立兹 ’(Berlitz)级——在旅游或商务旅行有限的词汇和句法上——的喜人成果。机器语汇和基础的文本转换已经可以在某些技术和法律通信上提供粗浅的辅助。但是诞生于20世纪五六十年代,对自然语言乃至文学进行机器翻译的说法正在销声匿迹。语义环境的变幻莫测极有可能让这样的念头成为黄粱一梦。”


然而斯坦纳不曾料到的是,在其晚年的20多年里,人工智能便进入新一轮发展高潮,其发展速度和规模一再超出人们的预料。在此AI第三次高潮时代,自然语言处理、机器学习和智能感知等新技术呈爆发增长,日益渗透到包括翻译在内的社会生活的各个领域。显然,传统的纯人工翻译模式已无法满足日新月异的行业和市场需求,不仅在日常交流、商务、法律、语言教育、科技交流等领域的翻译,远远超出早期“粗浅”的辅助水平,甚至已对人工翻译形成日益严重的职业威胁。翻译行业的发展又推动了翻译记忆、术语管理、神经网络翻译等一大批新技术的出现,引发了翻译模式的划时代变革。即便是自然语言处理和文学文本的机器翻译,也从半个多世纪前的“说法”和猜想,俨然成为一种无法忽略的现实存在;斯坦纳当年所说的那种 “念头”不仅没有“销声匿迹”,反而经过不断的尝试与改进,一再挑战包括口语与书面语翻译,乃至各种文本生成(写作)等语言处理的各个环节。于是,以技术驱动、智能模型为核心的翻译模式日益被接受,并显示了广泛的应用前景,甚至形成了一种规模化的服务产业。


总之,全球化时代广泛的跨文化交流需求,使得翻译行为遍布人类社会活动的各种场景,翻译需求日益普遍,而翻译的社会与市场需求,又刺激AI技术的高速发展,也推动了翻译模型的不断更迭改进,而新的解决方案反过来又激发了对机器翻译的新想象、新期待和新尝试。这种新的想象和期待,同样也会突破“社会需求——解决方案——模型建构”这一运用循环,触发翻译研究对翻译的内涵与外延、人工智能翻译模型的内在逻辑机制等理论问题的重新思考,同时也给我们重新反思翻译作为跨文化实践在全球化时代的文化意义,审视文化翻译研究在当代翻译学中的境遇,追问翻译文化研究何为,以及文学翻译在其中所担当的独特角色等,呈现出新的必要性和可能性。


跨文化时代翻译需求和翻译活动的普遍性,也体现为翻译对象即翻译语料—文本的海量涌现和多样性。这就要求翻译研究在两个向度上同时拓展和深入:1)需要前沿学科的刺激、引领和多学科的交叉与融合;2)需要把遍布当代社会生活各个领域并呈现为各种形态的翻译语料—文本做必要的分类。由此,根据对象的不同特点选择差异化的研究方法与研究路径,以推动翻译研究进一步深入。在这个意义上,学科分化与学科交叉融合,应该是翻译研究之当代发展的一体两面。


从翻译语料—文本的分类特征角度看:一方面,科学技术类文本、信息类文本包括日常基本交际语料,在当今高度全球化的进程中,已经形成或基本形成了语际间的普世性和文化间的强对应性。 比如科学研究、技术分析与运用、产品说明、媒体新闻报道、日常语用交际等翻译文本—语料,随着跨文化交际的常态化和普遍化,其大部分语言要素与语言单元,都已经形成了一种普适性的表达方式。凭借历史悠久并日益频繁的跨文化交际和翻译实践的累积,语言系统之间的共通性日渐明显,从而在不同语言间建立了(原文—译文间)高度对应性的关系。另一方面,不同语言体系毕竟采用不同的文字与声音符号系统加以呈现,并与其所对应和指称的不同文化相关联,因而语言间的对应性又必然呈现出某种相对性,也即所谓原语—译语的对应性总是不完整、不彻底、不精确的。从外在客观对象的命名,到人际社会关系的描述,再到人类情感精神的细分,直至思维方式与文化价值观念的建构,在不同语言体系的表达方式之间,其对应性程度就呈弱化趋势。


当然,从翻译对象角度所做的这种分类描述,与其说是“分”出了两个具有不同特征的翻译之“类”,毋宁说不过是描述了全球化与后科学时代的翻译在语际间对应性上的一个强—弱渐变的光谱。如果把这一光谱放在人类语言与文化的历史长河中加以回溯,其源头可以追溯至“ 巴别塔寓言”或“ 巴别塔宿命”。具有跨文化普适性和标准化符号表达系统的科技语料—文本处于这一光谱的一个端点上:它具有(翻译)标准化程度高,(原语—译语)对应性强的特点;在光谱的另一端,则对应性弱、标准化程度低,具体表现为原语—译语间的多重对应、模糊对应甚至无对应状态。比如汉语“小说”在英文中有多个对应词,而“表姨夫”则找不到确切的英文表述,更无论“道” “德”等具有高度文化特质的精神性概念。像文学、哲学类文本,就在这个弱对应性的端点上。而其他体量庞大、种类繁多、发生于不同文化空间、承担不同社会语用功能的翻译语料—文本,则处于这一对应性强—弱光谱的某个中间位置上。进一步引入时间维度,则相同或者相似的语料—文本又会在这一光谱中发生不同程度的偏离或者游移。如果从翻译对象即翻译实践所处理的语料—文本的上述光谱分析出发,回过头来考察人工智能时代的翻译技术进步,或许可以从21世纪以来所发生的重大进展中,以一个特定的角度认识和描述机器翻译的发生机理和内在逻辑。


半个多世纪以来,机器翻译(MT)技术的开发与研究,从基于语法规则、实例数据、统计方法的机器翻译时代,发展到以编码—解码为基本框架而设计的、利用神经网络对翻译过程建模的神经机器翻译的新阶段。在翻译实践中,日益成熟的语料库技术催生了基于翻译记忆的机器辅助翻译软件与平台,使机器翻译模式成为主流;机器翻译技术的进一步发展,尤其是2016年神经网络机器翻译技术的出现,又打破了机器辅助翻译一统天下的格局,机器翻译的译后编辑也由幕后走向前台。近年来,基于深度学习的自适应技术为翻译行业的变革再一次注入了新的活力,人机交互理念、人机共译模式已从理想变为现实。相对于之前的机器翻译系统,神经机器翻译在建模方式上进行了重要变革,从基于源语文本与译语文本的隐藏结构的假设和人工框架的设计,发展到针对编码和解码的分阶段建模,再配合深度学习的训练以逐步提升翻译效能。这一新方法有效地规避了依赖人工设计特征的传统语言模型(即上述基于规则、实例和统计的人工模型)的性能限制;同时结合微调方式,可以在大量无标签数据上学习语言的深层表示,从而使包括机器翻译在内的自然语言处理有了空前规模的突破式发展。其最新进展就是2022年以ChatGPT为代表的大语言模型的出现,它们的发布更加速了交互式机器翻译模式的应用。这一系列变革的发生,一波再接一波,一浪高过一浪,使人工智能新技术下的机器翻译,大有势不可挡,一路高歌之势。


但值得注意的是,这种基于海量数据(语料库)和大规模预训练(大语言模型)的自然语言处理, 是计算机科学、人工智能和语言学等学科的交叉前沿领域,它在本质上是包括翻译在内的理解、处理和生成语言的一种“算法”;在新技术语境下,翻译只不过是跨语言、跨文化的理解、处理和生成语言的一种特殊“算法”。而自然语言处理至今所依托的语言学基础,是将语料—文本按语言学的四个不同层次,即“词法分析”、“文本组块”(短语)、“句法”和 “篇章”(外加语用分析)展开分析,以完成文本语料库的标注、分析和建模。这种“算法”的逻辑,在本质上并没有超越对自然语言的如下假设:即源语言具有相应的内在结构,人不仅可以把握这个结构,而且可以通过把握和驾驭这个结构来理解与分析所有既存的话语文本,进而可以翻译(转换)不同的语言系统,最后生成新的文本(即机器写作)。简单概括其内在逻辑,就是它虽有大规模数据(有效经验积累)的支撑,但并没有摆脱对既有经验的依赖。它在思路上暗含着这样一种逻辑:对既成语用经验的归纳,足以应对未来的语用实践。我们不能说这种思路否认了语言的变化和语用的创造性,但它显然对这种变化和创造性的程度,对语用实践本身的开放性和可能性事先给予了限定。


同样,神经机器翻译的基本原理在这一系列目不暇接的变革更迭中有没有实质性和根本性的改变? 在深度学习技术所带来的改进算法中,目前影响最大的是依赖于循环神经网络(Recurrent Neural Networks,即 RNN)和卷积神经网络(Convolutional Neural Networks,即 CNN),前者为“谷歌翻译”,后者为 Facebook、DeepL 所采用。其功效的发挥固然和语料库的大小,包括稀缺语料(小语种)的开发,也和语料库效能紧密相关的语料标注等有着很强的关联性。所谓深度优化、专用云、私有云的发展设计,也是出于应对自然语言的复杂多义特性的考量,在一定程度上纳入了理解阐释/翻译主体的认知进程,也反映了当前翻译实践的广泛性和高度分化的特性。这些都是决定迄今机器翻译改进程度的关键因素。


但所有这些解决方案的基本运作逻辑,仍然基于对已完成译本的分析解读,仍然没有或无法突破对既有经验的依赖,即对既有语用经验记录的归纳和建模。而对于自然语言的语用实践中的新变部分,基于这种逻辑的解决方案注定存在着延后处置的情形。对于不同文化场景中语用实践(或有意或无意)中的变异和(有意的)创新,神经机器翻译只能在具有先期翻译实践的前提下,才能加以归纳和吸收,从而调整既有的编码—解码模型,再用以指导对相似文本的处理(翻译),因而也就没有为斯坦纳所谓“语义环境的变幻莫测”和语用实践的未来性、开放性预留足够的空间。


而所有语言文化的创造和新变,包括作为语言艺术的文学,就包含于这种不可预料的可能性之中。其中诗歌则是翻译弱对应文本中最具典型性的文类,因为在不同语言系统的所有文类中,诗歌是与其所用语言的所有文化特征(包括语音、文字、语义及其相互关系)关系最为密切的话语或文体。从翻译研究的角度看,在这个语际关系光谱的弱对应端点上,几乎集中了翻译理论史上关于“可译性悖论”的大部分不可译案例。据称由美国诗人弗罗斯特(Robert Frost,1874−1963)所表达的“(译)诗是翻译中丢失的东西”(Poetry is what gets lost in translation.)就是不可译论的一种典型表述。 换句话说,文学文本是最具特定语言/文化特征的文类之一。由于作为语言艺术的现代学科定位,文学文本更将不同文化系统间的差异性和独特性,深刻地浸润到语言符号的各个层次、各个环节之中。如果说,上述新技术语境下机器翻译所依赖(或至今无法真正摆脱)的内在逻辑,是基于既有语用经验前提下的分析建模,由此形成自然语言处理的一系列不断更迭的解决方案,那么,文学尤其是诗歌语用的最大特点,恰恰是对陌生化语用方式的无止境的探索和发明,是(作家/诗人)对语用实践的个体独特性的不懈追求。


新技术语境下的翻译研究,在高对应性文本之语际转换生成的解决方案上,已然取得了令人瞩目的空前进展,并已经或即将形成规模庞大的服务产业,深度影响了当代人类生活尤其是广泛的跨文化交际实践。但那些主要基于高对应性关系的解决方案,在面对语际弱对应性文本,面对作为翻译语料—文本的文学、哲学文本,以及体现不同文化系统的思想、文化和信仰内涵的文本时,其有效性显然有所不足,真正有效的文学(尤其诗歌)、思想和哲学文本的机器翻译的可能性至今未曾显现,而人工翻译仍显示着足够的必要性和创造性空间。这种局面未必是机器翻译发展不足所致,至少是上述基于既成翻译经验的分析建模逻辑下的机器翻译所无法解决的,超人工智能可否有望提供有效的解决方案还未可知。在这个意义上,以文学翻译及其研究为代表的翻译文化研究,仍有其不可替代的意义。甚至可以进一步说,正是迄今为止的机器翻译偏于处理高对应性文本,有意无意地相对忽略了翻译实践本身所包含的跨文化意义,包括跨文化传播、变异和创造中的丰富内涵。因此,在新技术语境下强调和推动翻译的文化研究的坚持、深入和拓展,不仅是出于寻求翻译弱对应文本的有效解决方案,更是从语际对应性强弱光谱的另一端出发,重新思考人工智能技术与作为文化实践行为的翻译之间整体关系的一种角度和方式。




参考文献

[ ]乔治 ·斯坦纳(美). 巴别塔之后 [M].孟醒,译杭州:浙江大学出版社,2020.

 2 ]肖桐,李垠桥,陈麒,朱婧波深度学习时代下的机器翻译[J]人工智能,2018,( 1):32−41.

[ ]赵铁军,许木璠,陈安东. 自然语言处理研究综述[J]新疆师范大学学报(哲社版),2024,( 1):174− 196.




作者简介

图片


宋炳辉,博士,教授 。研究方向:比较文学与跨文化研究、中外文学关系、汉语翻译文学研究 。

 文献来源|原载《外国语》2024年第1期。

 推送已获作者授权,引用请以期刊版为准。