第40 卷第2 期
2013 年2 月
计算机科学
Computer Science Feb2013
基于翻译规则的统计机器翻译
刘颖姜巍
(清华大学中文系
北京100084)
摘要扩展 HMM 模型可以解决词语对齐结果与句法约束冲突,从而更好地进行词语对齐。在短语对齐基础上利
用目标语言的短语结构树抽取翻译规则。采用扩展 CYK 算法 CYKA+ 作为系统的解码器,该算法可以处理非乔姆斯基范式的翻译规则;采用两轮解码算法在解码过程中整合语言模型。实验表明,与传统词语对齐模型相比,改进的 HMM 词语对齐模型具有更高的对齐准确率,并且翻译结果的 BLEU 评测得分更高。采用翻译规则的系统在不同数据集上具有更稳定的翻译结果。两轮解码算法与立方剪枝算法具有相近的解码质量,但前者解码速度更快。
关键词
统计机器翻译,扩展 HMM 模型,翻译规则,CYK+ 算法,BLEU 评分
中图法分类号
文献标识码
A
ranslationBasedonTranslationRules
LIU Ying JIANG Wei
(DepartmentofChineseLanguageandLiterature,TsinghuaUniversity,Beijing100084,China)
Abstract Improvedhidden Markovmodelwasusedtoalignwordsandsolvetheinconsistencybetweenwordalignment
CYK -CYK+ algorithm wasusedasthedecoderandatwo-pass-decodingalgorithm wasproposedforintergratingthe languagemodelduring decoding,whichcan decodenon-Chomsky the BLEUscoreofimproved HMMishigherthanthescoreofHMM,andthetranslationqualityoftranslationrulesisbet- terthanphrase--pass-decodingalgorithmisclosetothescoreofcube prunealgorithmanddecodingtimecostsless.
Keywords ranslation,Improvedhiddenmarkovmodel(HMM),Translationrule,CYK+ algorithm,
BLEU
基于句法的翻译模型利用句法分析器或树库的信息,期
引言
1
望获得句法信息的指导。基于句法的模型应当能够兼容所有
IBM 的 Brown等人于1993 年提出了基于词对齐的5 个
复杂度递增的
基于翻译规则的统计机器翻译 来自淘豆网www.taodocs.com转载请标明出处.