在线机器翻译软件的科技术语英译评析——以《抗击新冠肺炎疫情的中国行动》白皮书为例

(整期优先)网络出版时间:2021-12-29
/ 3

在线机器翻译软件的科技术语英译评析——以《抗击新冠肺炎疫情的中国行动》白皮书为例

朱思捷

西安科技大学人文与外国语学院 陕西省西安市 710699

摘要:机器翻译技术是如今译员及普通用户首选的翻译手段,但目前针对在线机器翻译软件的研究寥寥可数,尤其是对在线机器翻译软件在科技术语中应用的研究更是廖若星辰。基于此,本文选取五款常用在线机器翻译软件比较《抗击新冠肺炎的中国行动》白皮书中的39个科技术语译文质量。研究发现,各个翻译软件的译文质量良莠不齐,其中主要问题为术语错译、漏译及误译。

关键词:在线机器翻译;科技术语;译文评析;《抗击新冠肺炎疫情的中国行动》

1 引言

1949年,机器翻译(Machine Translation)思想滥觞于Weaver的《翻译》附录中[1]。机器翻译是指使用机器(常指计算机)实现将语篇从一种自然语言转化为另一种自然语言[2]。机器翻译也是人工智能的一个重要分支,它试图用计算机模拟人的翻译行为 [3]。七十多年来,随着计算机软件技术发展,新算法的出现以及计算机更新换代,机器翻译取得了巨大的发展和突破[4],基于其效率高、便捷性大以及实惠经济等特点,在线机器翻译软件已成为辅助甚至代替人工翻译的有效方法。近几年来,众多学者开始聚焦于机器翻译研究。根据知网数据,仅仅2015年至2020五年间,有关机器翻译研究的论文有3200多篇,尤其是2019年就有1300多篇,占41.9%。有学者探讨了机器翻译软件在材料文摘[5]、法律[6]、医学[7]等文本应用中所存在的问题。然而,目前研究关于科技术语的机器翻译软件比较研究凤毛麟角。鉴于此,本文选取百度翻译、谷歌翻译、必应翻译、金山翻译、和有道翻译五款常用在线机器翻译软件,对各个软件所导出的译文进行对比评析,旨在为译者在使用在线翻译软件作业时提高翻译效率和疑问质量提供参考。

2 在线机器翻译软件的译文质量评析

2.1 研究方法

评价机器翻译主要根据七大因素,分别是:译文的质量、应用效率、工作方式、使用环境、维护性和扩展性、机器翻译系统性能价格比、鲁棒性(robustness)[8]。其中,术语翻译的准确度直接影响翻译质量[9],是机器翻译评价的重要指标。

由于其包含数量众多的科技术语,本文选取《抗击新冠肺炎疫情的中国行动》白皮书[10]中的一个自然段落作为研究样本,以自然句为单位将其分为8个单元,用T(Terminology)代表科技术语或直接传达相关信息的部分。以中华人民共和国国务院新闻办公室所发布的英文版本[11]为对照组标准译文。然后将源文本分别导入:百度翻译、谷歌翻译、必应翻译、金山翻译、和有道翻译五款在线机器翻译软件,得到的五篇机器译文为实验组,通过传统统计方法,对所得实验组译文进行对比分析。

2.2 数据处理与对比分析

设定对照组的标准译文为满分,分别将实验组的五篇机器译文的每个T项译文与对照组的T项译文进行比较,译文接近的记为100分,较为接近记50分,偏差较大则不得分,统计后分别得出五篇机器译文各个单元的T项总分,再统计每款在线机器翻译软件在三个等级:译文准确、较为准确和偏差较大的数量,最终得出下图:



61cbf1007ef5d_html_fcf414e7a2a874b1.png



图1 五篇机器译文 T项得分


从图1可以看出,百度翻译和谷歌翻译的“译文准确”的频次最高,分别为2次;其他三个翻译软件的“译文准确”次数都仅有1次;“较为准确”频次较高的为百度翻译与必应翻译,均为5次,其他翻译软件此项的频次皆为4次;“偏差较大”频次高的则为金山翻译和有道翻译,为3次,而谷歌翻译和必应翻译“偏差较大”的频次为2,百度翻译此项频次仅为1。综上可以看出,翻译质量较高的为百度翻译,质量低的为金山翻译和有道翻译。

3 科技术语机器翻译的主要错误分析

为了进一步了解实验组译文的翻译错误,本文对实验组译文中“较为准确”和“偏差较大”的单元进行详细分析,统计发现,以上五款在线机器翻译软件在处理科技类术语时,主要存在术语错译、漏译和误译等翻译错误。

3.1 术语错译

能否准确地翻译术语,直接关系翻译质量地优劣[12]。本文从实验的文本中抽取部分机译错误较高的术语(T项),对五篇机器译文与对照组进行比对和考察。经整理,原文、对照组译文和五组实验组译文的部分T项翻译结果为下表:

61cbf1007ef5d_html_f2604cdbdfcc82db.png


由上表可知,五篇机器翻译译文对此领域的术语翻译均不正确甚至错误,这说明机器对术语的内涵和理解存在一定的障碍。

3.2 漏译及错译

漏译是指因系统问题等原因,在一文中漏掉原文中部分词或句的翻译[13]。在进行机器翻译时,发现有部分翻译软件有明显的漏译、误译现象,以下是问题较严重的句子:

原文:加强流行病学追踪调查,精准追踪和切断病毒传播途径,截至5月31日,全国累计追踪管理密切接触者74万余人。

对照组标准译文:Epidemiological tracing and investigation were enhanced to precisely detect and cut off virus transmission routes. As of May 31, a total of more than 740,000 close contacts had been traced and handled as appropriate.

百度翻译:As of May 31, more than 740000 close contacts have been tracked and managed in China.

谷歌翻译:Strengthen the epidemiological follow-up investigation, accurately track 43 and cut off the virus transmission route. As of May 31, the country has tracked and managed more than 740,000 close contacts.

必应翻译:Strengthen epidemiological follow-up investigation, accurately track 43 and cut off the transmission of the virus, as of May 31, the country's cumulative tracking management of close contacts more than 740,000 people.

金山翻译:Strengthen epidemiological tracking investigation, accurate tracking 43 and cut off the transmission of the virus, as of May 31, the country's cumulative tracking management close contact more than 740000 people.

有道翻译:By May 31, China had tracked and managed more than 740,000 close contacts.

首先对比以上译文可以看出,百度翻译和有道翻译不知出于何种原因,有明显的漏译现象,将整句关键信息都未译出。

相较之下,其他三组没有出现严重的漏译现象,但也存在误译现象,例如,对照组译文将“追踪调查”译为“tracing and investigation”,而谷歌翻译和必应翻译都将其译为 “follow-up investigation”,再比如,对照组译文将“精准追踪”译为“precisely detect”,而谷歌翻译、必应翻译和金山翻译分别将其译为“accurately track”,“accurately track”及“accurate tracking”。显然,机器翻译只是翻译出了字面意思而忽视了这些词真正的含义。

4 结语

本文对比探讨了五款在线翻译软件科技类术语英译文的差异,结果发现,这五款机器翻译软件的译文质量存在明显的差异,在翻译此类科技术语时,百度翻译质量略高于其他软件,但仍与对照组标准译文存在较大差距。常见错误有术语错译、漏译及误译。总体来看,这五款翻译软件虽可达到翻译出较为完整、无语法错误且语意较为通顺的句子,但仍达不到应用所需标准,因此,在翻译过程中虽可借助机器翻译软件来提高效率,但译者仍需进行译后编辑,以此来保证译文质量。

此次实验具有一定的局限性。首先,此次实验只针对中译英,市面上多数翻译软件都是国外公司的翻译引擎,在中译英和英译中翻译过程中,质量有明显差异,还需继续实验发现其异同。第二,此次实验的样本较小,只可反映目前在线机器翻译软件在处理科技类本文时的部分问题,不能全面地反映错误,今后可选取更大的实验样本,或不同领域的样本,来对目前市面上的机器翻译软件存在的问题进行探讨。

5 参考文献

[1] W.Weaver. Translation. William N. Locke and A. Donald Booth, editors, Machine Translation of Languages. MIT Press, 1955, 15-23.

[2] Hutchins, W.J.Machine Translation: Past,Present,and Future.Chichester: Ellis Horwood Limited,1986

[3] 冯志伟. 自然语言计算机形式分析的理论与方法[M].合肥:中国科学技术大学出版社, 2017.

[4] 崔启亮. 论机器翻译的译后编辑[J].中国翻译,2014,35(06):68-73.

[5] 孙逸群. 材料类文摘机助翻译的错误剖析[J]. 中国科技翻译, 2018, 31(03): 15-18.

[6] 严胜琳. 机器翻译软件对比——以法律文本为例[J].现代商贸工业,2019,40(01):161-162.

[7] 杨明星, 吴丽华. 医学文本Trados机辅翻译的质量与效率优势[J].中国科技翻译,2016,29(03):30-32+20.

[8] 张法连. 法律翻译中的机器翻译技术刍议[J].外语电化教学,2020(01):53-58+8.

[9] Arnold D. & Lee H. Machine Translation: Special Issue on Evaluation of MT system[A]. In Arnold D. &Louisa S. Evaluation: An Assessment [C]. Dordrecht: Kluwer Academic Publishers, 1993.

[10] 《抗击新冠肺炎疫情的中国行动》白皮书http://www.scio.gov.cn/zfbps/32832/Document/1681801/1681801.htm

[11] Full Text: Fighting COVID-19: China in Action

http://www.scio.gov.cn/zfbps/32832/Document/1681809/1681809.htm

[12] 张法连. 法律翻译中的文化传递[J]. 中国翻译,2019, 40(02): 165-171.

[13] 崔启亮, 李闻. 译后编辑错误类型研究——基于科技文本英汉机器翻译[J].中国科技翻译, 2015, 28(04): 19-22.

3 / 3