如何利用机器翻译将单语参考文件转换为双语参考记忆库(TM)
译员经常会收到这样的翻译任务:客户提供一个中译英项目,并附一英文文件,要求译员在翻译过程中参考此文件中的用词以及句式。 按照传统方法,通常需要把这个文件通读一遍,了解文件的内容、结构、词汇、句式,做到心中有数,以便在翻译时回想、参照文件内容。 开始作业后,遇到相关词句,先猜中文对应的英文,然后在参考文件里面搜索猜测的关键词。由于一个中文词对应的英文单词可能有好多个,所以不一定能搜到目标词。 那么有没有一种高效而且相对可靠的方法来解决这个难题呢? 这里介绍一个方法。 打开Trados Studio,用机器翻译引擎把英文参考文件译为中文,得到英中记忆库TM1。新建或导入待翻译的中译英项目,在项目设置里面,新建记忆库TM2,作为项目作业记忆库;把由参考文件机译形成的记忆库TM1导入,作为参考记忆库。 注意,TM1不可直接导入,因为其与项目语言对方向不一致。 Trados Studio支持的记忆库大致分两类:本地(File-based TM)与云上(Server-based TM)。本地TM保存在用户电脑磁盘上,存取速度快,操作自由度高,是最常用的记忆库类型。云上TM保存在客户服务器上,因为易于管理,且保密性更好,目前越来越流行。 这两种TM都有一个潜在要求:TM语言对方向与项目语言对方向必须一致。相应的,就产生了一个局限性:无法使用同语言对、不同译出方向的记忆库。 这就催生了第三类TM——任意记忆库(AnyTM)。也分为基于文件的任意记忆库(AnyTM: Any File-based TM)和基于服务器的任意记忆库(AnyTM: Any Server-based TM)。与上述两种记忆库特点相同,唯一不同之处是:AnyTM支持语向转换,即一个项目中同语言对、不同译出方向的记忆库可通用。 正是这一功能盘活了用户的语料,并使本文中的操作(英译中项目导入中英方向TM)成为可能。 续接上文,通过基于文件的任意记忆库功能导入TM1后,即可开始作业。 假设文中有一句话译文与参考文件中某一句相同或相似,Trados Studio会提示:TM1中有句段与此时正在翻译的句段相同或相似,并以百分比显示二者匹配率。这样就可以通过比对原文,确定不一致之处,再修改匹配的译文。如此重复,直至完成整个文件的翻译。 这样做的好处是:即遵循了客户所提出的参比翻译之要求,又保证了工作效率。 可能有人会担心,这个参考记忆库是由机器翻译生成,未经人工校对,准确率低,真的有参考价值吗? 虽然机器翻译不准,但至少可以达到40%至60%的准确率,这对于参考来说已经足够。在Trados Studio里面,有一个功能叫做片段匹配(Fragment match)。如果原文句段跟记忆库句段不是100%匹配,而是一个词或者几个词匹配,也会跳出匹配结果。这个功能的工作原理相当于人工猜测原文对应的译文,然后用猜测的关键词去参考文件中搜索,最后返回可能性最高的结果。 本文所述方法使用前提有二:一、具有一个可靠、高质量的机器翻译引擎,用于将单语文件转为双语文件。二、进行翻译作业的内容管理系统支持记忆库语向转换,用于将目标语至源语的记忆库转为源语至目标语的记忆库。最好再附加一条:系统支持片段匹配,从而提高搜索出目标句词的概率。 具备上述三项条件,则可采用此法。