|
- 2016
人机翻译英语被动句相似度的向量距离测算
|
Abstract:
基于语料库翻译学和文本挖掘的方法,提出了一种将向量空间模型与主成分分析相结合的向量距离算法,用以测算在线机器翻译(“在线机译”)与人工翻译在对应翻译英语被动句上的相似度。测算结果表明,人工译本和在线机译都体现了英语被动句翻译的不对等性,均将少量英语被动句译成汉语被动句。研究结果或为译本对比及文本相似度的测量提供一种新的数理统计算法,从而更加客观、科学地对比译本之间的异同。
By combining corpus-based translation studies with textual data mining methods, this research proposes a new vector distance algorithm by combining Vector Space Model (VSM) and Principal Component Analysis (PCA), to measure the similarity between online translation and human translation of English passives into Chinese passives in a formally parallel manner. The results show that not many English passives are translated correspondingly into Chinese passives. The four human translated texts studied are close to each other but far from online translation in vector distance, indicating a low similarity between human and online translations.Conclusively, the results and method of this study can be applied to translation comparison and provide a new statistical algorithm for measuring textual similarity so as to study and compare different translated texts more objectively
[1] | [5]黄立波, 王克非. 语料库翻译学:课题与进展[J]. 外语教学与研究,2011(6):911-921. |
[2] | [10]李梅, 朱锡明. 译后编辑自动化的英汉机器翻译新探索[J]. 中国翻译, 2013(4):83-87. |
[3] | [11]柏晓静, 詹卫东. 汉语“被”字句的约束条件与机器翻译中英语被动句的处理[R]. 武汉:汉语被动表述问题国际学术研讨会,2003. |
[4] | [13]简?奥斯汀. 傲慢与偏见[ M]. 王科一, 译. 上海:上海译文出版社, 1980. |
[5] | [14]简?奥斯汀. 傲慢与偏见[ M]. 孙致礼, 译. 南京:译林出版社, 1985. |
[6] | [15]简?奥斯汀. 傲慢与偏见[ M]. 张玲, 张扬, 译.北京:人民文学出版社, 1993. |
[7] | [16]简?奥斯汀. 傲慢与偏见[ M]. 张经浩, 译. 杭州:浙江文艺出版社, 2004. |
[8] | [18]王力. 汉语语法史[M]. 北京:商务印书馆, 2005:285. |
[9] | [22]屈梁生, 张西宁, 沈玉娣. 机械故障诊断理论与方法[M]. 西安:西安交通大学出版社, 2009:170-173. |
[10] | [23]傅德印. 主成分分析中的统计检验问题[J]. 统计教育, 2007(9):4-7. |
[11] | [17]QUIRK Q S, GREENBAUM G, et al. A comprehensive Grammar of the English Language [M]. London:Longman Group United Kingdom, 1985:167-171. |
[12] | [24]LI CHARLES N, SANDRA A. Thompson:Mandarin Chinese-A Functional Reference Grammar[M]. Berkeley and Los Angeles:University of California Press, 1981:498. |
[13] | [25]XIAO R, A MCENERY, Y QIAN. Passive constructions in English and Chinese-A corpus-based contrastive study [J]. Languages in Contrast, 2006 (6):109-149. |
[14] | [19]屈哨兵. 现代汉语被动标记研究[M]. 武汉:华中师范大学出版社, 2008:2-36. |
[15] | [2]郭庆琳, 李艳梅, 唐琦. 基于VSM的文本相似度计算的研究[J]. 计算机应用研究, 2008 (11):3256-3258. |
[16] | [6]黄伟, 刘海涛. 汉语语体的计量特征在文本聚类中的应用[J]. 计算机工程与应用, 2009(29):25-27. |
[17] | [12]郑声滔. 将英语被动句顺译成汉语被动句的技巧[J]. 重庆邮电学报, 2003 (1):83-91. |
[18] | [20]朱华宇, 孙正兴, 张福炎. 一个基于向量空间模型的中文文本自动分类系统[J]. 计算机工程, 2001[2]:15-17. |
[19] | [21]苏振魁. 基于马尔科夫模型的文本相似度研究[D]. 大连:大连理工大学, 2007:2. |
[20] | [1]袁军鹏, 朱东华, 李毅等. 文本挖掘技术研究进展[J]. 计算机应用研究, 2006 (2):1-3. |
[21] | [3]王克非. 语料库翻译学探索[M]. 上海:上海交通大学出版社, 2012:58-114. |
[22] | [4]蒋跃. 人工译本与机器在线译本的语言计量特征对比――以5届韩素音翻译竞赛英译汉人工译本和在线译本为例[J]. 外语教学, 2014(5):98-103. |
[23] | [7]胡显耀. 基于语料库的汉语翻译语体特征多维分析[J]. 外语教学与研究, 2010(6):451-458. |
[24] | [8]董?L. 基于降维法的译者风格研究[J]. 外语教学与研究, 2014(2):282-293. |
[25] | [9]戴新宇, 尹存燕, 陈家骏,等. 机器翻译研究现状与展望[J]. 计算机科学, 2004(11):176-179. |