人工智能翻译助力网文“一键出海”

发布时间:2025-01-04 12:23:04 来源: sp20250104

原标题:人工智能翻译助力网文“一键出海”

“土生土长”的中国网络文学已成为世界文化奇观。根据中国作协发布的相关数据,海外用户超过1.5亿人,覆盖200多个国家和地区。

海外阅读需求旺盛,但相较堪称海量的中国网络文学而言,“出海”作品仍是少数。中国网文“出海”至今,累计输出作品16000余部,而仅2022年,国内新增作品就有300多万部。每天有百万海外读者盯着屏幕、在线“催更”,“出海”作品“供不应求”。

翻译是第一道关卡。篇幅巨大、作品海量,而翻译人才不足,成为影响网络文学更大规模走出去的重要因素。

近年来,人工智能(AI)为网文“出海”打开了一扇窗。日前,在第二届上海国际网络文学周上发布的《2023中国网络文学出海趋势报告》显示,截至2023年10月,阅文集团旗下海外门户起点国际已上线约3600部翻译作品,同比三年前增长110%。在人工智能的助力下,网文的翻译效率提升近百倍,成本降低超九成。

AI正推动网文规模化“出海”,让“一键出海”“全球追更”成为可能。

翻译效率提高3600倍,成本降到人工翻译的1%

中文翻译本来就难,文学翻译更难。“信达雅”是文学翻译的基本标准,网络文学翻译也不例外。

在中国社科院研究员陈定家看来,网文在翻译上要尽量满足三个标准:准确性、流畅性、艺术性,“网络文学的翻译应该尽可能准确地传达原文的意思,包括各种语义、文化和情感内涵。译者应该具有良好的语言表达能力,使译文在目标语言中能被自然流畅地阅读”。

北京大学中国语言文学系博士研究生雷宁观察到,对北美受众而言,太极、功夫、龙等中国元素并不陌生。然而好莱坞大片式的文化传播与网文翻译的本质区别在于,前者多用文化符号拼贴的方式打造“中国印象”,难以摆脱隔岸观火的猎奇目光,后者是爱好者主动进行的文化交流行为,借由逐字逐句的翻译来更深入地传导文化。这无疑对译者有很高的要求。

更新效率又关乎用户的黏度。根据艾瑞咨询发布的《2019年中国网络文学出海报告》,影响海外网文用户体验的最主要因素是网文“出海”的效率。超八成的用户会把“作品更新稳定,题材多样”作为选择平台的第一要素,他们常遇到的问题是“正在更新的小说更新太慢和突然停更”,“想看的小说没人翻译”。

翻译难度大,成本也高。有业内人士表示,网络文学请专业译者翻译的价格,基本是每1000字200元的报酬。而作品动辄几百万字,成本何其之高。即使这样,对优秀的翻译人才来说,也不具备吸引力,他们更愿意做同声传译或者金融、法律、医疗等领域的翻译。

技术革新开辟了一条新路。2018年,国内自主研发的首个网络文学人工智能翻译系统推出并应用,大大提升了翻译效率和作品“出海”数量。推文科技创始人童晔算了笔账,AI能使翻译效率提高3600倍。具体来说,对于1000字的翻译,人工需要1小时,AI只需要1秒;成本也降低到原来的1%,100万字的专业译者翻译需要20万元,AI只需要不到1000元。

中国音像与数字出版协会副秘书长李弘表示,目前,我们已经可以借助AI将网文翻译为英语、西班牙语、印尼语、葡萄牙语、德语、法语、日语等多种语言,不仅中国网文从中受益,海外原创网文也有了更大的传播空间。

人工智能翻译可以达到“理解上下文”的程度

人工智能翻译准不准呢?童晔给出直观答案:“100分的满分,专业译者可以拿到85分,AI翻译可以拿到75~80分。”

“比方说,翻译口语中的‘梗’,人工智能之前不行,现在可以了。”童晔说,人工智能先把“梗”变成平铺直叙的语言,再从目标语言中寻找一种相应的“梗”,这更符合“信达雅”的翻译要求。

精确度如何实现的呢?一些网文平台发布的资料显示,正如人类翻译受自身知识面的限制一样,AI模型达到的能力范围也受到语料范围的限制,所以要尽可能丰富地给AI“喂料”。平台基于自然语言理解技术,对网文内容进行深入挖掘。通过对大量网文内容和优质社区内容的标注和识别,使机器更好地理解网文内容。比如,AI可以自动识别角色、场景、题材、故事脉络等信息,构建网文的整体知识图谱。目前,AI翻译能够较好地翻译网文特殊领域中的词、句、段落,包括人名、地名以及类似“金丹”“解药”这种特有元素词,还能识别出各种代词指代的对象,尽可能避免传统机译中“一词多译”“张冠李戴”等现象。

彩云科技CEO袁行远解释说,人工智能在翻译时,会从原文中提取出人物并判断其性别。它在判断什么词是人名时,会依据一些语法规则,例如“××说”,“说”字前的名词一般是一个人。利用类似的方式,人工智能就能获得一张专有词表,使得翻译工作得以顺利推进。另一方面,过去常见的“逐句翻译”常常忽略语境,导致翻译结果僵硬、不知所云,而目前的机器翻译已经发展到“理解上下文”的程度。

不过,这只是技术上的进步,精准翻译具备了可能性,还无法进行规模化应用。业内人士指出,比较浅白的表述,AI可以“猜”出正确的翻译,但遇到比较迂回的表述,比如语料中从未出现过的成语,AI猜错的可能性就会变大。例如,“燃灯如豆”可能被直译成“火焰像豆子”,机器无法理解深层的内涵。同时,它也不能理解故事的复杂逻辑,无法判断前面一个伏笔会成为故事后面至关重要的因素,这都是尚需进一步探索的课题。

人工智能翻译还离不开人的“精加工”

是否使用人工智能翻译,不同的作家学者也有不同的理解。

人工智能追求效率提升的同时,难免会丢失文本质量、消损原著色泽。首都师范大学教授许苗苗观察到,对于热爱写情节、开脑洞,不太在意风格的作者,特别是那些热爱IP转化,从文字作者变成编剧的作者来说,机器翻译不成问题,而对于钟爱自己语言风格的作者来说是致命的,“这样的翻译缺乏独特性,翻译出来的文本只是内容而非风格”。

地域特色翻译、本土语境表达仍是很多作家关注的问题。陈定家指出,在翻译的过程中,基于海量信息的大型语言处理机器,难以处理一些复杂的语言现象,如文化差异、本土语境等,只能严格遵守语法规则与句式结构,无法准确传达作者的审美趣味与情感追求,导致扁平化的翻译结果。

阅文集团副总裁、总编辑杨晨也把术语翻译的准确性作为AI翻译的首要挑战,“像人物称谓、门派、功法、修炼等中国网文、中国文化中特有的语言术语和表达方式,单纯依靠AI翻译无法准确表达其内涵”。

目前,人工智能翻译还离不开人的“精加工”。中南大学教授欧阳友权认为,“人—机”协作才能保证质量。因为受目前技术水平所限,人工智能翻译的缺点是明显的,但“机译”的发展方向是对的,当弱人工智能升级为强人工智能时,也许这个问题就解决了。

艾瑞咨询发布的《2021年中国网络文学出海研究报告》指出,现阶段,通过出海服务商为内容平台提供优质的AI翻译,加上后期的专业译者校对润色,优势互补,正在帮助网络文学快速规模化出海,特别是在2020年多语种市场布局加速的背景下,人工智能翻译的应用能够帮助企业快速实现语言的迁移。

杨晨表示,阅文集团组织了超过3万人次的读者测试及反馈,对AI翻译的细节进行不断地微调,使翻译更贴近海外读者的阅读习惯。网文平台需要重建网文翻译的流程和体系,搭配人工校正来综合优化AI翻译内容。

(责编:杨曦、李楠桦)
选择用户
全部人员 全选 撤消
谢志刚
李岩
李海涛
谢志强
李亚琴
潘潇潇
杨亚男
高荣新
郑文静
金琳
张银波
张欣
陈曦
刘涛
王长青
高广柱
孙圆
行政专员
付雪枫
张雪莲
张璐
刘相群
张明璇
李静
孙静
王晨
赵夏
马洪亮
张兰
黄莉
李潍伊
常恩宁
侯昭宇
韩岩峰
冯亚红
林洋
陈静
刘婧
魏保国
唐彦秀
张楠
刘瑞萍
付严明
荣伶
马建国
邓爱青
系统管理员