基于改进字节对编码的汉藏机器翻译研究

头旦才让; 仁青东主; 尼玛扎西; 于永斌; 邓权芯

doi:10.12178/1001-0548.2020218

基于改进字节对编码的汉藏机器翻译研究

doi: 10.12178/1001-0548.2020218

1.
青海师范大学藏文信息处理教育部重点实验室　西宁　810008
2.
西藏大学信息科学技术学院　拉萨　850000
3.
电子科技大学信息与软件工程学院　成都　610054

基金项目: 国家自然科学基金(61262051)；国家社会科学基金(19XYY021)；国家重点研发计划重点专项(2017YFB1402200)；青海省科技计划(2017-GX-146, 2017-ZJ-767)

详细信息

作者简介:
头旦才让(1988-)，男，博士生，主要从事藏语计算语言学方面的研究

通讯作者: 尼玛扎西，E-mail：niqiongda@163.com

中图分类号: TP391.1

Research on Chinese-Tibetan Machine Translation Model Based on Improved Byte Pair Encoding

1.
Key Laboratory of Tibetan Information Processing, Ministry of Education, Qinghai Normal University　Xining　810008
2.
School of Information Science and Technology, Tibet University　Lhasa　850000
3.
School of Information and Software Engineering, University of Electronic Science and Technology of China　Chengdu　610054

摘要: 该文通过改进字节对编码算法，提出了带字数阈值的藏文字节对编码算法，优化了基于注意力机制的汉藏神经机器翻译模型。收集整理了100万汉藏句对和20万汉藏人名地名词典，训练了汉藏神经机器翻译模型。通过测试和验证，模型的BLEU值达到36.84。该模型的命名实体翻译效果优于已商用汉藏在线翻译系统。同时，该文的神经机器翻译模型已部署于汉藏机器翻译网站，实现了汉藏神经机器翻译系统的应用推广。
- 注意力机制 /
- 字节对编码 /
- 汉藏神经机器翻译 /
- 命名实体识别
Abstract: In order to optimize Chinese-Tibetan neural machine translation (NMT) based on attention mechanism, this paper proposes a Tibetan byte-pair encoding algorithm with maximum byte threshold to improve the original byte-pair encoding algorithm. By collecting one million Chinese-Tibetan sentence pairs and dictionaries with 200, 000 Chinese-Tibetan names and places, we train the Chinese-Tibetan NMT model using attention mechanism. Our model has a better translation result in named entity compared with commercial using of Chinese-Tibetan online translation and it achieves 36.84 in bilingual evaluation understudy (BLEU) score. Our work has already deployed in Chinese-Tibetan machine translation system web which will promote the spread and application of Chinese-Tibetan NMT system.
- attention mechanism /
- byte pair Encoding /
- Chinese-Tibetan neural machine translation /
- named entity recognition

图 1 基于注意力机制的神经网络翻译模型

下载: 全尺寸图片幻灯片

图 2 原始BPE算法流程图

下载: 全尺寸图片幻灯片

图 3 改进的BPE算法流程图

下载: 全尺寸图片幻灯片

图 4 汉藏神经机器翻译模型总体流程

下载: 全尺寸图片幻灯片

图 5 汉藏神经机器翻译系统总体架构

下载: 全尺寸图片幻灯片

表 1 实验数据集

实验数据	句子数	词语总数	人名地名数
验证集	1000	27863	3174
测试集	1000	28333	3243

下载: 导出CSV

表 2 实验数据、方法、结果

实验数据	实验1	实验2	实验3	实验4	实验5	实验6
训练集/万	80	80	80	80	100	100
题材	新闻、法律	新闻、法律	新闻、法律	新闻、法律	新闻、法律、其他	新闻、法律、其他
汉文分词	感知机	感知机	Hanlp	BPE	BPE	BPE
藏文分词	Perceptron+CRF	BPE	BPE	BPE	BPE	改进BPE
人名、地名/万	0	0	0	20	20	20
验证集BLEU值	30.46	31.56	31.84	33.87	34.09	36.84

下载: 导出CSV

表 3 本系统与已商用化的汉藏翻译系统翻译实例结果对比

原文1	广州到布里斯班的机票要多少钱？
参考译文1
本文译文1
腾讯译文1
小牛译文1
翻译局译文1
原文2	斯蒂尔和弗里曼都说自己该得到总经理的职位。
参考译文2
本文译文2
腾讯译文2
小牛译文2
翻译局译文2
原文3	甘南藏族自治州夏河县与合作市接壤，地处青藏高原东部。
参考译文3
本文译文3
腾讯译文3
小牛译文3
翻译局译文3

下载: 导出CSV

[1]	李沐, 刘树杰, 张冬冬, 等. 机器翻译[M]. 北京: 高等教育出版社, 2018. LI Mu, LIU Shu-jie, ZHANG Dong-dong, et al. Machine translation[M]. Beijing: Higher Education Press, 2018.
[2]	刘洋. 神经机器翻译前沿进展[J]. 计算机研究与发展, 2017, 54(6): 1144-1149. doi: 10.7544/issn1000-1239.2017.20160805 LIU Yang. Recent advances in neural machine translation[J]. Journal of Computer Research Development, 2017, 54(6): 1144-1149. doi: 10.7544/issn1000-1239.2017.20160805
[3]	KALCHBRENNER N, BLUNSOM P. Recurrent continuous translation models[C]//Proceedings of Empirical Methods in Natural Language Processing (EMNLP). Stroudsburg, PA: ACL, 2013: 1700-1709.
[4]	CHO K, VAN M B, GULCEHRE C, et al. Learning phrase representations using RNN encoder-decoder for statistical machine translation[C]//Proceedings of the 2014 Conference on Empirical Methods in Natural Language Processing (EMNLP). [S. l.]: ACM, 2014: 1724-1734.
[5]	BAHDANAU D, CHO K, BENGIO Y. Neural machine translation by jointly learning to align and translate[EB/OL]. [2019-11-01]. http://de.arxiv.org/pdf/1409.0473.
[6]	JUNCZYS-DOWMUNT M, DWOJAK T, HOANG H. Is neural machine translation ready for deployment? A case study on30translation directions[EB/OL]. [2019-11-01]. https://arxiv.org/pdf/1610.01108.pdf.
[7]	TAN Zhi-xing, SU Jin-song, WANG Bo-li, et al. Lattice-to-sequence attentional neural machine translation models[J]. Neurocomputing, 2018, 284: 138-147.
[8]	谭知行. 格到序列神经机器翻译研究[D]. 厦门: 厦门大学, 2018. TAN Zhi-xing. Research on lattice-to-sequence neural machine translation[D]. Xiamen: Xiamen University, 2018.
[9]	张文, 冯洋, 刘群. 基于简单循环单元的深层神经网络机器翻译模型[J]. 中文信息学报, 2018, 32(10): 36-44. doi: 10.3969/j.issn.1003-0077.2018.10.006 ZHANG Wen, FENG Yang, LIU Qun. Deep neural machine translation model based on simple recurrent units[J]. Journal of Chinese Information Processing, 2018, 32(10): 36-44. doi: 10.3969/j.issn.1003-0077.2018.10.006
[10]	ZHANG J J, ZHAO Y, LI H R, et al. Attention with sparsity regularization for neural machine translation and summarization[J]. IEEE/ACM Transactions on Audio, Speech, and Language Processing, 2019, DOI: 10.1109/TASLP.2018.2883740.
[11]	ZHANG B, XIONG D Y, SU J. Neural machine translation with deep attention[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2020, DOI: 10.1109/TPAMI.2018.2876404.
[12]	李亚超, 熊德意, 张民, 等. 藏汉神经网络机器翻译研究[J]. 中文信息学报, 2017, 31(6): 103-109. doi: 10.3969/j.issn.1003-0077.2017.06.014 LI Ya-chao, XIONG De-yi, ZHANG Min, et al. Research on Tibetan-Chinese neural network machine translation[J]. Journal of Chinese Information Processing, 2017, 31(6): 103-109. doi: 10.3969/j.issn.1003-0077.2017.06.014
[13]	李博涵, 刘汇丹, 龙从军. 深度学习在汉藏机器翻译中的应用研究[J]. 民族翻译, 2018(3): 51-58. LI Bo-han, LIU Hui-dan, LONG Cong-jun. Application of deep learning in Chinese-Tibetan machine translation[J]. Ethnic Translation, 2018(3): 51-58.
[14]	桑杰端珠. 稀疏资源条件下的藏汉机器翻译研究[D]. 西宁: 青海师范大学, 2019. SANGJIE Duanzhu. Research on Tibetan-Chinese machine translation under sparse resources[D]. Xining: Qinghai Normal University, 2019.
[15]	慈祯嘉措, 桑杰端珠, 孙茂松, 等. 融合单语语言模型的藏汉机器翻译方法研究[J]. 中文信息学报, 2019, 33(12): 61-66. doi: 10.3969/j.issn.1003-0077.2019.12.008 CIZHEN Jiacuo, SANGJIE Duanzhu, SUN Mao-song, et al. Tibetan-Chinese machine translation based on tibetan language model enhanced transform[J]. Journal of Chinese Information Processing, 2019, 33(12): 61-66. doi: 10.3969/j.issn.1003-0077.2019.12.008
[16]	RANZATO M, CHOPRA S, AULI M, et al. Sequence level training with recurrent neural networks[EB/OL]. [2019-10-12]. http://de.arxiv.org/pdf/1511.06732.
[17]	SENNRICH R, HADDOW B, BIRCH A. Neural machine translation of rare words with subword units[C]//Proc of the 54th ACL. Stroudsburg, PA: ACL, 2016: 1715-1725.
[18]	史加荣, 王丹, 尚凡华, 等. 随机梯度下降算法研究进展[J/OL]. 自动化学报, [2020-03-11]. https://doi.org/10.16383/j.aas.c190260. SHI Jia-rong, WANG Dan, SHANG Fan-hua, et al. Research advance on stochastic gradient descent algorithms[J/OL]. ACTA Automation SINICA, [2020-03-11]. https://doi.org/10.16383/j.aas.c190260.
[19]	ZEILER M D. ADADELTA: an adaptive learning rate method[EB/OL]. [2019-11-10]. http://export.arxiv.org/pdf/1212.5701.
[20]	WISEMAN S, RUSH A. Sequence-to-sequence learning as beam-search optimization[C]//Proc of EMNLP. Stroudsburg, PA: ACL, 2016: 1296-1306.
[21]	头旦才让, 仁青东主, 尼玛扎西. 基于CRF的藏文地名识别技术研究[J]. 计算机工程与应用, 2019, 55(18): 111-115. doi: 10.3778/j.issn.1002-8331.1903-0232 THUPTEN Tsering, RINCHEN Dhondub, NYIMA Tashi. Research on Tibetan location name recognition technology under CRF[J]. Computer Engineering and Applications, 2019, 55(18): 111-115. doi: 10.3778/j.issn.1002-8331.1903-0232
[22]	仁青东主, 头旦才让, 尼玛扎西. 汉藏机器翻译研究综述[J]. 中国藏学, 2019(4): 222-226. RINCHEN Dhondub, THUPTEN Tsering, NYIMA Tashi. A summary of research on Chinese-Tibetan machine translation[J]. China Tibetology, 2019(4): 222-226.
[23]	汤连杰. HanLP2.0[J]. 软件和集成电路, 2019(8): 95. doi: 10.3969/j.issn.2096-062X.2019.08.047 YANG Lian-jie. HanLP2.0[J]. Software and Integrated Circuit, 2019(8): 95. doi: 10.3969/j.issn.2096-062X.2019.08.047
[24]	LUONG M, SUTSKEVER I, LE Q, et al. Addressing the rare word problem in neural machine translation[C]//Proc of the 53rd ACL. Stroudsburg, PA: ACL, 2015: 11-19.
[25]	JEAN S, CHO K, MEMISEVIC R, et al. On using very large target vocabulary for neural machine translation[C]//Proc of the 53rd ACL. Stroudsburg, PA: ACL, 2015: 1-10.
[26]	厦门大学自然语言处理实验室. 云译神经机器翻译系统[EB/OL]. [2020-03-05]. http://nmt.xmu.edu.cn. Xiamen University Natural Language Processing Laboratory. Cloud translation neural machine translation system[EB/OL]. [2020-03-05]. http://nmt.xmu.edu.cn.
[27]	中国民族语文翻译局. 民族语文在线翻译 [EB/OL]. [2020-03-05]. http://www.mzywfy.org.cn/translate.jsp. China Minzu Language Translation Bureau. MINZU language online translation[EB/OL]. [2020-03-05]. http://www.mzywfy.org.cn/translate.jsp.
[28]	东北大学自然语言处理实验室. 小牛翻译开放平台[EB/OL]. [2020-03-05]. https://niutrans.vip/trans. Natural Language Processing Laboratory at Northeastern University. niutrans[EB/OL]. [2020-03-05]. https://niutrans.vip/trans.
[29]	林倩, 刘庆, 苏劲松, 等. 神经网络机器翻译研究热点与前沿趋势分析[J]. 中文信息学报, 2019, 33(11): 1-14. doi: 10.3969/j.issn.1003-0077.2019.11.001 LIN Qian, LIU Qing, SU Jin-song, et al. Focuses and frontiers tendency in neural machine translation research[J]. Journal of Chinese Information Processing, 2019, 33(11): 1-14. doi: 10.3969/j.issn.1003-0077.2019.11.001

[1]	陈欣, 李闯, 金凡. 量子自注意力神经网络的时间序列预测 . 电子科技大学学报, 2024, 53(1): 110-118. doi: 10.12178/1001-0548.2022340
[2]	刘志刚, 张国辉, 高月, 刘苗苗. 多因素引导的行人重识别数据增广方法研究 . 电子科技大学学报, 2024, 53(2): 235-242. doi: 10.12178/1001-0548.2023056
[3]	崔少国, 独潇, 张宜浩. 基于兴趣注意力网络的会话推荐算法 . 电子科技大学学报, 2024, 53(1): 67-75. doi: 10.12178/1001-0548.2022307
[4]	要媛媛, 付潇, 杨东瑛, 王洁宁, 郑文. 结合全局信息增强的医学领域命名实体识别研究 . 电子科技大学学报, 2024, 53(): 1-10. doi: 10.12178/1001-0548.2023064
[5]	李阳, 李春璇, 徐灿飞, 方立梅. 基于残差注意力机制的肺结节数据增强方法 . 电子科技大学学报, 2023, 52(6): 880-886. doi: 10.12178/1001-0548.2022363
[6]	莫太平, 黄巧人, 陈德鸿, 伍锡如, 张向文. 改进可逆缩放网络的图像超分辨率重建 . 电子科技大学学报, 2023, 52(5): 739-746. doi: 10.12178/1001-0548.2022261
[7]	黄颖, 许剑, 周子祺, 陈树沛, 周帆, 曹晟. 高效长序列水位预测模型的研究与实现 . 电子科技大学学报, 2023, 52(4): 595-601. doi: 10.12178/1001-0548.2022133
[8]	赵云龙, 田生祥, 李岩, 罗龙, 齐鹏文. 基于注意力模型和Soft-NMS的输电线路小目标检测方法 . 电子科技大学学报, 2023, 52(6): 906-914. doi: 10.12178/1001-0548.2022290
[9]	张凤荔, 王雪婷, 王瑞锦, 汤启友, 韩英军. 融合动态图表示和自注意力机制的级联预测模型 . 电子科技大学学报, 2022, 51(1): 83-90. doi: 10.12178/1001-0548.2021100
[10]	王磊, 孙志成, 王磊, 陈端兵, 蒋家玮. 基于DRSN-CW和LSTM的轴承故障诊断 . 电子科技大学学报, 2022, 51(6): 921-927. doi: 10.12178/1001-0548.2021385
[11]	代翔. 基于事件模式及类型的事件检测模型 . 电子科技大学学报, 2022, 51(4): 592-599. doi: 10.12178/1001-0548.2021377
[12]	葛唯益, 程思伟, 王羽, 徐建. 基于双向门控循环神经网络的事件论元抽取方法 . 电子科技大学学报, 2022, 51(1): 100-107. doi: 10.12178/1001-0548.2021153
[13]	周丰丰, 牛甲昱. 细胞穿膜肽识别问题的多特征融合卷积网络预测算法 . 电子科技大学学报, 2022, 51(4): 494-499. doi: 10.12178/1001-0548.2021391
[14]	郭磊, 王邱龙, 薛伟, 郭济. 基于注意力机制的光线昏暗条件下口罩佩戴检测 . 电子科技大学学报, 2022, 51(1): 123-129. doi: 10.12178/1001-0548.2021222
[15]	毛文清, 徐雅斌. 基于深度图卷积网络的社交机器人识别方法 . 电子科技大学学报, 2022, 51(4): 615-622, 629. doi: 10.12178/1001-0548.2021280
[16]	崔少国, 陈俊桦, 李晓虹. 融合语义及边界信息的中文电子病历命名实体识别 . 电子科技大学学报, 2022, 51(4): 565-571. doi: 10.12178/1001-0548.2021350
[17]	赵磊, 高联丽, 宋井宽. 面向视觉对话的自适应视觉记忆网络 . 电子科技大学学报, 2021, 50(5): 749-753. doi: 10.12178/1001-0548.2021057
[18]	李学明, 岳贡, 陈光伟. 基于多模态注意力机制的图像理解描述新方法 . 电子科技大学学报, 2020, 49(6): 867-874. doi: 10.12178/1001-0548.2019228
[19]	杨越, 黄瑞章, 魏琴, 陈艳平, 秦永彬. 基于上下文语义的新闻人名纠错方法 . 电子科技大学学报, 2019, 48(6): 809-814. doi: 10.3969/j.issn.1001-0548.2019.06.002
[20]	邓钰, 雷航, 李晓瑜, 林奕欧. 用于目标情感分类的多跳注意力深度模型 . 电子科技大学学报, 2019, 48(5): 759-766. doi: 10.3969/j.issn.1001-0548.2019.05.016

点击查看大图

图(5) / 表(3)

计量

文章访问数: 5448
HTML全文浏览量: 1541
PDF下载量: 42
被引次数: 0

全文HTML

机器翻译是利用计算机自动地将一种自然语言转换为相同含义的另一种自然语言的过程^[1]。机器翻译在语言形态上分为语音翻译和文本翻译，其历史发展已从基于规则的机器翻译、基于统计的机器翻译发展至基于神经网络的机器翻译(即神经机器翻译)。目前，神经机器翻译已经取代统计机器翻译，成为Google、微软、百度、搜狗等商用在线机器翻译系统的核心技术^[2]。

神经机器翻译最早在2013年被提出，但是存在长距离重新排序和梯度爆炸消失等问题，翻译效果不理想^[3]。2014年，文献[4]提出了编码器和解码器框架，引入了长短时记忆模型，解决了长距离重新排序和梯度爆炸消失等问题，同时神经机器翻译的主要难题变成了固定长度向量问题。2015年，文献[5]将注意力机制应用到机器翻译中，解决了固定长度向量问题。

注意力机制的模型将注意力放在一些相关性高的词上，编码器和解码器之间通过注意力机制连接^[6]，在翻译目标单词时检测其与源端语句相关的部分，解码时融合了更多的源语言端信息，可以显著提升机器翻译效果，是目前神经机器翻译的主流方法，应用广泛。2018年，文献[7]使用自注意力机制来增强序列标注模型的全局表示能力，从序列标注任务端减少汉文分词对随后翻译对影响的方法。在此基础上，文献[8]提出了格到序列的神经机器翻译模型。通过实验，该模型在翻译性能上显著优于传统的基于注意力机制的序列到序列基线系统。同年，文献[9]提出简单循环单元的注意力机制模型。2019年，文献[10]提出了一个稀疏注意力模型，解决了注意力权重分布问题。2020年，文献[11]提出了一种深度注意力模型，大大提高了系统翻译的忠实度。综上，基于注意力机制的模型成为目前神经机器翻译领域的主流模型。

近几年，研究人员在基于注意力机制模型的基础上，利用不同的方法进行了汉藏藏汉神经机器翻译研究。2017年，文献[12]基于注意力机制和迁移学习方法，将英汉神经网络机器翻译模型参数迁移到藏汉神经网络机器翻译模型中。2018年，文献[13]将注意力机制模型应用于汉藏机器翻译任务中，实现了汉藏书面语料和口语语料的神经机器翻译。2019年，文献[14]在transformer模型上，运用百万句子单语数据大规模迭代式回译策略，实现了藏汉神经机器翻译模型，文献[15]也使用transformer实现了藏汉神经机器翻译模型，并将藏语单语语言模型融合到藏汉神经机器翻译中。

汉藏机器翻译中的命名实体处理一直是最难以突破的一个技术环节，为处理命名实体、同源词、外来词和形态复杂的词，本文在模型训练时，改进藏文字节对编码算法，优化了基于注意力机制的翻译模型，使得汉藏神经机器翻译效果更加准确。

4. 结束语

本文利用100万汉藏句对和20万汉藏人名地名词条，进行了基于注意力机制的神经机器翻译实验，并提出了一种改进的BPE算法，用以协调原始BPE得到的藏文粒度大于汉文粒度的情况，将BLEU提升了2.75%，减少了过度翻译、翻译不充分的问题，提升了命名实体翻译效果。设计实现了基于注意力机制和改进字节对编码的汉藏神经机器翻译模型，部署在阳光汉藏机器翻译网站，实现了该汉藏神经机器翻译系统的应用推广。本文汉藏机器翻译系统的模型具有语言无关性，完全可以应用到藏汉神经机器翻译研究中。

由于汉藏神经机器翻译目前缺乏大规模双语数据，而藏语单语语料比较充足，所以下一步将利用格到序列、半监督和无监督方法提升翻译效果。

共享和开放是计算语言学(自然语言处理)研究的发展趋势，该工作在汉英机器翻译技术领域获得了很好的进展，免费开放了一些汉英英汉双语平行语料，使得汉英机器翻译技术具有可比性和竞争性。汉藏机器翻译研究语言资源较少，没有公开的语料，而且资源问题一直是困扰神经机器翻译研究和产业化的首要问题^[29]。为此，我们开放了部分实验数据和藏文地名词典(获取地址：https://github.com/toudancairang/Tibetan-Computational-linguistics/tree/master)，希望吸引更多的人参与其中，建立藏文资源开放平台，推动藏语计算语言学(藏语自然语言处理)研究，促进中文信息处理技术的整体发展。

致谢：该模型的构建得到了中科院计算所自然语言处理实验室同仁的大力支持。

参考文献 (29)

姓名
邮箱
手机号码
标题
留言内容
验证码

留言板

基于改进字节对编码的汉藏机器翻译研究

doi: 10.12178/1001-0548.2020218

作者简介:
头旦才让(1988-)，男，博士生，主要从事藏语计算语言学方面的研究

通讯作者: 尼玛扎西，E-mail：niqiongda@163.com

Research on Chinese-Tibetan Machine Translation Model Based on Improved Byte Pair Encoding

计量

基于改进字节对编码的汉藏机器翻译研究

doi: 10.12178/1001-0548.2020218

1. 青海师范大学藏文信息处理教育部重点实验室　西宁　810008

2. 西藏大学信息科学技术学院　拉萨　850000

3. 电子科技大学信息与软件工程学院　成都　610054

作者简介:
头旦才让(1988-)，男，博士生，主要从事藏语计算语言学方面的研究

通讯作者: 尼玛扎西，E-mail：niqiongda@163.com

English Abstract

Research on Chinese-Tibetan Machine Translation Model Based on Improved Byte Pair Encoding

全文HTML

1.1. 注意力机制模型

1.2. 改进的藏文字节对编码算法

1.2.1. 字节对编码

1.2.2. 改进的藏文字节对编码算法

2.1. 数据集

2.2. 参数设置

2.3. 结果与分析

2.4. 与已商用化的汉藏翻译对比

3.1. 汉藏神经机器翻译模型总体流程

3.2. 本文汉藏机器翻译系统架构

目录

期刊在线

编辑办公

友情链接

留言板

基于改进字节对编码的汉藏机器翻译研究

doi: 10.12178/1001-0548.2020218

作者简介: 头旦才让(1988-)，男，博士生，主要从事藏语计算语言学方面的研究

通讯作者: 尼玛扎西，E-mail：niqiongda@163.com

Research on Chinese-Tibetan Machine Translation Model Based on Improved Byte Pair Encoding

计量

出版历程

基于改进字节对编码的汉藏机器翻译研究

doi: 10.12178/1001-0548.2020218

1. 青海师范大学藏文信息处理教育部重点实验室 西宁 810008 2. 西藏大学信息科学技术学院 拉萨 850000 3. 电子科技大学信息与软件工程学院 成都 610054

作者简介: 头旦才让(1988-)，男，博士生，主要从事藏语计算语言学方面的研究

通讯作者: 尼玛扎西，E-mail：niqiongda@163.com

English Abstract

Research on Chinese-Tibetan Machine Translation Model Based on Improved Byte Pair Encoding

全文HTML

1.1. 注意力机制模型

1.2. 改进的藏文字节对编码算法

1.2.1. 字节对编码

1.2.2. 改进的藏文字节对编码算法

2.1. 数据集

2.2. 参数设置

2.3. 结果与分析

2.4. 与已商用化的汉藏翻译对比

3.1. 汉藏神经机器翻译模型总体流程

3.2. 本文汉藏机器翻译系统架构

目录

期刊在线

编辑办公

友情链接

作者简介:
头旦才让(1988-)，男，博士生，主要从事藏语计算语言学方面的研究

1. 青海师范大学藏文信息处理教育部重点实验室　西宁　810008

2. 西藏大学信息科学技术学院　拉萨　850000

3. 电子科技大学信息与软件工程学院　成都　610054

作者简介:
头旦才让(1988-)，男，博士生，主要从事藏语计算语言学方面的研究