飞跃迷雾--浅谈机器翻译软件的发展走势
机器翻译的发展史告诉我们,伴随着信息技术的发展以及全球网络的一体化趋势,机器翻译技术也得以不断提高,翻译软件的辅助翻译作用愈发明显。而对于从事机器翻译研究的专家、学者或软件开发人员来说,机器翻译的发展过程,其实就是一步一步跨越机器翻译技术障碍的过程。
跨越障碍
作为不同语言之间的翻译交流,机器翻译既是一门科学,也是一门艺术。随着计算机应用技术的不断发展,为了解决计算机语言交流的复杂、繁琐、枯燥等问题,机器翻译的研究工作开始了新的里程。 几十年来,国内外许多专家、学者为机器翻译的研究付出了大量的心血和汗水。但是,至今还没有一个完善、实用、全面、高质量的自动翻译系统出现,这也说明了语言翻译的难度之大。应该说,机器翻译经过几十年的发展,还是取得了很大的进展,特别是作为人们的辅助翻译工具,机器翻译已经得到大多数人的认可,近年来国内外翻译软件的蓬勃发展,就证明了这一点。目前,国内的机器翻译软件就不下百种,根据这些软件的翻译特点,大致可以分为三大类:词典翻译类、汉化翻译类和专业翻译类。 词典类翻译软件占主导地位的应该就是金山软件公司的《金山词霸》了。《金山词霸》堪称是多快好省的电子词典,它可以迅速查询英文单词或词组的词义,并提供单词的发音,为用户了解单词或词组含义提供了极大的便利。
汉化翻译软件的典型代表是北京实达铭泰公司开发的《东方快车2000》,它首先提出了“智能汉化”的概念,改变了过去“即时汉化”的不足,也使人们对翻译软件有了更新的认识,使翻译软件的辅助翻译作用更加明显。《东方快车 2000》为用户提供了“智能汉化集成环境”,为不会英语或英语水平不高的人提供了“语言障碍的全面解决方案”,包括内码转换、动态汉化和电子词典等,很好地满足了用户汉化英文软件、英文网页,实现对屏幕英文信息的了解和文章的初步翻译等,对信息获取、了解文章大意有相当实际的作用。
以译星、雅信译霸为代表的专业翻译系统,是面对专业或行业用户的翻译软件。这类软件具有传统语法规则的翻译内核,其自动翻译的可读性效果如何,一直是翻译软件企业的努力方向。在自动翻译方面,译星具有一定的优势,但其专业翻译的质量与人们的实用性还有很大差距,所以,在好长一段时间里,专业翻译软件一直处于徘徊不前的状态。
国际上有关专家分析认为:机器翻译要想达到类似人工翻译一样的流畅程度,至少还要经历15年时间的持续研究。也就是说,在人类对语言研究的同时,还无法明了“人脑是如何进行语言的模糊识别和判断”的情况下,机器翻译要想达到100%的准确率是不可能的。
一位翻译界权威人士曾这样评价目前的状况:“国内市场上的几种专业翻译软件的操作程度、翻译准确性、可读性等都相差不大,翻译机理也大同小异,因此,专业翻译软件的发展几乎处于停滞状态。如果没有新的开发思路,翻译技术得不到提高,国内的专业翻译软件市场就谈不上发展,也会走向瓶颈状态。我们必须另辟新路,寻找新的解决方法。”
另辟蹊径
应该说,在很多领域里,计算机辅助人类工作的方式得到了广泛的应用,值得我们借鉴。例如:CAD软件,它并不是代替人工进行工作,而是给我们提供方便的操作平台,辅助我们高效率地完成相应的工作,从而减少重复和机械劳动,提高工作效率。其实,我们并不要求计算机自动设计出一个机器模型、画出一幅美丽的图画,或帮我们写出一篇文章,这毕竟太过分了。我们也不会要求计算机象翻译专家一样自动地完成语言的翻译。对于我们来说,计算机只是起着辅助人工的作用,如果计算机辅助技术用于语言的翻译研究,应该同样可以起到很大的辅助作用,这就是所谓的“计算机辅助翻译”(Comp uterAidedTranslation,简称CAT)的概念。它集机器记忆式翻译、语法分析式翻译和人际交互式翻译为一体,把翻译过程中机械、重复、琐碎的工作交给计算机来完成。这样,翻译者只需将精力集中在创造性的思考上,有利于工作效率的提高。
长期以来,科技资料的翻译就是科研机构、大学、情报部门以及大型企业的重要工作之一。随着国际交往的增多,资料翻译也显得越来越重要。特别是对于一些大型的引进项目,其外文资料往往数以吨计,这些资料若仅靠人工翻译,难度可想而知,还不适应规模化生产,因而,依靠机器翻译来进行前期的“粗翻译”,再经过人工的“过滤”,就显得轻松多了。
商机无限
其实,翻译工作者都能发现翻译过程中常见的规律:一是重复的内容多(相同的句子或片段反复出现);二是相似的句型和句式反复出现;三是在翻译过程中最耗费精力和时间的是查词典、书写、录入或编辑。而如果有了计算机辅助翻译系统(CAT),以上问题就可以迎刃而解了,它能提供最佳解决方案,使翻译效率事半功倍。
有关专家经过大量的研究和统计表明,在翻译相同的专业文献时,很多内容会重复出现,最高时重复率达60% 。如果提供一个记忆机制,使相同或相似的句子只需翻译一次,就可以存在机器里,这样,就能减少重复性的劳动,提高翻译速度。在翻译时,系统通过搜索记忆库,对需要译的内容进行分析、对比,给出翻译建议和参考译例,使相同的句子或片段不要翻译第二遍,这在翻译同类文章时非常有效。尤其是对某些产品的说明书,只要翻译一个版本,在今后产品升级换代或出现相关产品时,许多内容都可以不用翻译就能直接使用。而如果融合网络技术建立资源站点,通过局域网和INTERNET实现资源共享,就可起到“自己翻译过的内容不用翻译,别人翻译过的内容也不用翻译”的作用。这样的结果是,只要有人曾翻译过某句话,其他人就不用再重复工作了。
在平时的翻译过程中,句型相同或相似的句子也经常出现,由于常用的翻译软件大多采用的是语法树结构的翻译内核,这种内核适用于比较有规律的语句,而对于变化多端的自然语言,采用千篇一律的翻译模式,往往不能奏效。另一种以语法模式为主的翻译内核,是基于传统语法树和以自然语言为基础的一种广义语法结构,计算机根据这些规则“举一反三”地进行翻译,在不断“学习”新语法的情况下,高质量的参考译文就出现了。广义语法的基础是“句型”和“类别”,这使语法的表现形式更简单、易用,并可分类继承,提高了系统的专业翻译水平。机器翻译的选词机制(从多义词中选择正确的词义)只有采用模式翻译内核,才能使机器翻译给出的参考译文更通顺、合理、可用。
翻译工作者普遍认为,翻译资料时最耗费精力的是要将翻译的结果写在纸上,然后输入计算机。而如果将这些时间用来思考,先借助翻译软件进行辅助翻译,再依靠人工进行智能化整合,那么翻译的效率将成倍提高。为了最大限度地降低翻译者的体力消耗和缩短翻译周期,使用计算机辅助翻译系统(CAT)显然是很好的做法。
CAT具备了方便的交互翻译体系,其主要操作点取鼠标即可完成,这样,翻译速度就得以提高。因此,只要预先在系统中存储大量的词库,翻译时,计算机就会自动把所翻译句子的每个单词或词组通过查词典的形式在屏幕上显示出来,并把高频词的释义放在首位,同时还能自动地给出参考译文。由于每个单词对应多个中文释义,如果计算机选择有误,可通过点击鼠标选择正确的释义加以替换。对于复杂句,人们可按照不同的理解方式,用鼠标点取计算机给出的中文组成通顺的译文。
其实,在翻译过程中,计算机给出的单词、词组或句子片段的中文解释,就如同大小不等的“构件”,人们根据需要,用鼠标选取这些“构件”加上一些连接词(我们称为“黏合剂”),就可以组成正确的译文。这样,在翻译过程中省去了查词典、书写、录入甚至排版等繁杂的工作,翻译家们才有更多的时间来思考和研究如何将文章翻译得更准确、更美妙!
当然,计算机辅助翻译系统所提供的几项功能是相辅相成的,记忆、分析、交互配合使用,这样的结果使翻译文章的速度提高了2倍,甚至更高。因此,作为电脑语言辅助工具的计算机辅助翻译系统,将在很大程度上改变目前专业翻译软件的现状,也为词典翻译类和汉化翻译类软件的开发提供了一个全新的思路,或许,国内沉寂许久的翻译软件行业又将迎来一个开发热潮,谁的技术领先谁就有可能获得巨大的市场回报。 不管怎样,如何提高翻译软件的质量、效果,增强可读性,是翻译软件企业必须面对的问题。而计算机辅助翻译系统的面市,必将给我们带来一次突破性的进展和新的市场机会。
河源翻译公司推荐阅读
随机文章