新書推薦:
《
惜华年(全两册)
》
售價:HK$
70.3
《
甲骨文丛书·古代中国的军事文化
》
售價:HK$
99.7
《
中国王朝内争实录(套装全4册):从未见过的王朝内争编著史
》
售價:HK$
244.2
《
半导体纳米器件:物理、技术和应用
》
售價:HK$
177.0
《
创客精选项目设计与制作 第2版 刘笑笑 颜志勇 严国陶
》
售價:HK$
61.6
《
佛山华家班粤菜传承 华家班59位大厨 102道粤菜 图文并茂 菜式制作视频 粤菜故事技法 佛山传统文化 广东科技
》
售價:HK$
221.8
《
武人琴音(十周年纪念版 逝去的武林系列收官之作 形意拳一门三代:尚云祥、韩伯言、韩瑜的人生故事 凸显百年武人命运)
》
售價:HK$
43.7
《
剑桥斯堪的纳维亚戏剧史(剑桥世界戏剧史译丛)
》
售價:HK$
154.6
|
內容簡介: |
机器翻译是由计算机自动将一种自然语言翻译成另一种自然语言的过程。随着语言资源规模的持续增长和计算机硬件技术的大幅提高,数据驱动的机器翻译方法逐渐获得了研究者的青睐,翻译效果取得了显著的提升。本书梳理了机器翻译的基础理论和研究进展,指出了数据驱动的机器翻译方法所面临的问题,详细介绍了具有代表性的改进方法。这些方法既包括对句法语义、词形和零代词、翻译记忆等先验知识的建模及融合,也涉及深度神经网络、无监督树学习、生成对抗训练、联合学习、因果推断等前沿技术,可供希望深入了解机器翻译研究进展的读者参考。本书的 后对数据驱动的机器翻译技术进行了总结,并对未来的研究方向进行了展望。
|
目錄:
|
●第1章 绪论1
1.1 研究背景及意义1
1.2 机器翻译发展简史2
1.3 研究内容及全书总览4
参考文献8
第2章 基础理论9
2.1 基于规则的机器翻译9
2.2 基于实例的机器翻译10
2.3 统计机器翻译11
2.3.1 噪声信道模型11
2.3.2 对数线性模型12
2.3.3 基于短语的统计机器翻译模型12
2.3.4 基于句法的统计机器翻译模型14
2.3.5 语言模型16
2.3.6 统计机器翻译存在的问题20
2.4 神经机器翻译20
2.4.1 基于循环神经网络的神经机器翻译模型21
2.4.2 基于卷积神经网络的神经机器翻译模型24
2.4.3 基于注意力网络的神经机器翻译模型27
2.4.4 束搜索30
2.4.5 神经机器翻译存在的问题及发展趋势31
参考文献34
第3章 基于句法语义知识的统计机器翻译44
3.1 引言44
3.2 基于句法和语义的统计机器翻译基础方法45
3.2.1 基于句法的统计机器翻译模型46
3.2.2 语义角色标注47
3.2.3 语义角色标注在统计机器翻译中的应用48
3.2.4 串到树模型49
3.3 基于浅层语义结构的统计机器翻译52
3.3.1 谓词-论元增强型句法树52
3.3.2 句法补充的谓词-论元树54
3.3.3 翻译规则的学习55
3.3.4 实验与分析56
3.4 基于句法语言模型的统计机器翻译62
3.4.1 句法语言建模的基础方法62
3.4.2 融合浅层句法特征的循环神经网络语言模型63
3.5 本章小结70
参考文献71
第4章 句法知识与神经机器翻译联合学习模型82
4.1 引言82
4.2 树结构学习的基础方法83
4.2.1 树结构的神经网络编码器84
4.2.2 树结构的神经网络解码器85
4.2.3 无监督树学习85
4.2.4 利用统计机器翻译短语表87
4.2.5 在神经机器翻译中学习短语87
4.2.6 基于句法的神经机器翻译88
4.2.7 对齐学习89
4.3 源端句法信息与神经机器翻译联合学习模型89
4.3.1 无监督树编码器90
4.3.2 无监督树与神经机器翻译联合学习92
4.3.3 实验分析97
4.3.4 实例分析101
4.4 双语句法成分对齐与神经机器翻译联合学习模型105
4.4.1 概述105
4.4.2 无监督树编码器107
4.4.3 对齐样本构建107
4.4.4 深度度量损失108
4.4.5 实验分析109
4.5 基于跨语言句法互信息的机器翻译114
4.5.1 概述114
4.5.2 双语句法对齐117
4.5.3 优选化双语句法相互依存120
4.5.4 实验分析121
4.6 本章小结126
参考文献126
第5章 基于句子对齐信息的机器翻译训练138
5.1 引言138
5.2 问题分析141
5.3 基于自注意力机制的对齐判别器143
5.3.1 基于门控自注意力网络的句子编码器144
5.3.2 句子对齐得分计算与判别器损失函数145
5.3.3 判别器训练数据构建与预训练146
5.4 基于对齐信息的神经机器翻译对抗训练147
5.4.1 判别损失函数147
5.4.2 Gumbel-Softmax 采样148
5.4.3 教师强制步骤149
5.4.4 固定的判别器与对抗的判别器149
5.5 基于对齐感知的神经机器翻译解码方法150
5.5.1 融合判别器得分的解码得分151
5.5.2 融合基于对齐的价值网络解码151
5.6 本章小结152
参考文献157
第6章 融合翻译记忆的神经机器翻译方法163
6.1 引言163
6.2 问题分析163
6.3 融合翻译记忆相似度的文本预处理方法165
6.3.1 模板165
6.3.2 相关工作166
6.3.3 基于多维相似度的机器翻译测试集预处理策略167
6.4 融合翻译记忆的机器翻译训练方法170
6.4.1 引言170
6.4.2 相关工作171
6.4.3 基于多维相似度的机器翻译训练方法172
6.4.4 实验分析174
6.5 融合模板翻译记忆的神经机器翻译方法178
6.5.1 概述178
6.5.2 相关工作179
6.5.3 翻译模板的定义与构建180
6.5.4 融合模板翻译记忆的神经机器翻译187
6.5.5 实验分析191
6.6 本章小结197
参考文献198
第7章 词形预测与神经机器翻译联合模型202
7.1 引言202
7.2 问题分析204
7.2.1 拉丁字符大小写对神经机器翻译的影响204
7.2.2 单词阴阳性对机器翻译的影响206
7.3 大小写敏感的神经机器翻译207
7.3.1 神经机器翻译模型207
7.3.2 引入大写标注的神经机器翻译208
7.3.3 神经机器翻译与大写预测联合学习209
7.4 性别敏感的神经机器翻译212
7.4.1 性别平衡伪数据构建方法213
7.4.2 插入性别标注214
7.4.3 性别预测与机器翻译联合建模214
7.5 本章小结215
参考文献218
第8章 融合零代词信息的机器翻译方法225
8.1 引言225
8.2 零代词推断的基础方法227
8.2.1 基于规则的方法227
8.2.2 序列标注法228
8.2.3 融入语义特征的方法229
8.3 基于特征的零代词推断方法232
8.3.1 融入双语信息的语料重构232
8.3.2 零代词处理方法235
8.4 基于CRF和SVM的零代词信息构建方法236
8.4.1 基于CRF的零代词位置标注236
8.4.2 基于SVM的零代词分类238
8.5 基于深度学习的零代词信息构建方法242
8.5.1 基于LSTM的零代词位置标注243
8.5.2 基于LSTM的零代词分类245
8.5.3 基于编码器-解码器架构的零代词重构模型245
8.6 融合零代词信息的统计机器翻译247
8.6.1 概述247
8.6.2 语料预处理方法247
8.6.3 概率特征方法248
8.6.4 译文重排序方法250
8.6.5 实验分析251
8.6.6 实验结果及分析254
8.7 基于无监督树学习和零代词重构的神经机器翻译258
8.7.1 概述258
8.7.2 基于零代词重构的口语机器翻译模型259
8.7.3 实验及分析263
8.8 本章小结271
参考文献271
第9章 基于因果推断的译文评分去噪声方法274
9.1 引言274
9.2 相关工作和背景知识278
9.2.1 NMT译文长度偏置问题278
9.2.2 句子级译文质量直接估计任务281
9.3 基于HSR的译文评分降噪方法283
9.3.1 基于HSR的NMT解码长度偏置修正283
9.3.2 讨论285
9.3.3 译文质量估计系统输出降噪方法287
9.4 NMT长度偏置消除实验290
9.4.1 回归模型的选择292
9.4.2 方法自适应性294
9.5 译文质量估计系统去噪声实验296
9.6 本章小结299
参考文献299
第10章 机器翻译评价及相关评测会议306
10.1 机器翻译评价指标307
10.1.1 准确率和召回率307
10.1.2 BLEU评价指标308
10.1.3 词错误率WER308
10.1.4 翻译编辑率TER309
10.1.5 NIST评价指标309
10.1.6 METEOR评价指标310
10.2 机器翻译大会WMT310
10.3 全国机器翻译大会CCMT312
10.4 国际口语翻译大会IWSLT313
10.5 NIST机器翻译公开评测314
10.6 亚洲语言机器翻译研讨会WAT315
参考文献316
第11章 总结与展望319
11.1 本书总结319
11.2 未来研究方向展望320
|
|