中国語エンジンの翻訳品質改善

近年、中国は著しい経済発展を遂げ、経済貿易が盛んになっています。来日観光客の人数も年々増加し、中国語翻訳の需要が高まっています。

そこで、より高品質の機械翻訳を提供するため、これまでの中国語エンジンを一新しました。

 

【日中エンジン】

弊社が長年培ってきた日英エンジンのノウハウを日中エンジンに転用しました。その結果、日本語の解析精度が高くなり、翻訳の精度が向上しました。

 

日本語機械翻訳品質向上例

下記は日本語の「~ねば~まい」の例です。改良前エンジンは誤って解析していました。改良後エンジンは日本語の構造を正しく認識するようになりました。

他社訳は原文とまったく反対の意味に訳されています。

原文 10年学ばねば分かるまい
参考訳 如果不学10年的话,就会明白。
改良後エンジン 如果不学10年的话,就知道。
改良前エンジン 如果不在10年学的话,将知道。
A社 如果我学习10年,我明白。
B社 10年了学习的话知道。
C社 了解, 如果它学会十年。

 

下記は多義のある動詞「乗せる」の例です。改良前エンジンは訳語の選択を誤っていました。改良後エンジンは目的語の性質(意味素性)を正しく解析するようになり、正しく訳せるようになりました。

他社訳はすべて原文の意味を正しく捉えられていません。

原文 株価は20,000円の大台に乗せた
参考訳 股价冲破了2万日元大关。
改良後エンジン 股价冲破了20,000日元大关。
改良前エンジン 让股价加入20,000日元的大关了。
A社 股价上涨了2万日圆。
B社 股票价格以2万日元为标志
C社 股票价格超过了20万日元的大关。

 

機械翻訳の品質向上の成果を検証するため、「機械翻訳+ポストエディット」の作業時間比較の実験を行いました。

「ポストエディット」とは機械翻訳の出力結果を人手により修正・編集する作業です。全てゼロから翻訳することなく作業できるので、翻訳者にとって作業時間の短縮、依頼者にとって翻訳にかかる費用の低減を実現させることが可能となります。

また、機械翻訳の精度が高くなればなるほどポストエディットの手間が減り、作業時間と費用削減の効果が大きくなります。

評価方法:

日本語の基本文法をベースにした文に、改良前と改良後の機械翻訳エンジンの翻訳結果を付与。翻訳者がポストエディットに要した作業時間を比較。

評価結果:

改良前エンジンの機械翻訳結果を用いたポストエディットの平均時間は3.5時間に対し、改良後エンジンの平均時間は2.5時間です。

機械翻訳エンジンの精度向上により作業時間が1.3倍速くなったと言えます。なお、翻訳精度とポストエディットによる翻訳時間の関係は下記の図で示します。

【中日エンジン】

以前と比べて、英語⇔欧州語、英語⇔日本語の機械翻訳精度が飛躍している一方、中国語からターゲット言語への機械翻訳精度がなかなか向上できていません。その理由は、他の言語よりも、中国語の解析が一段と難しいからです。

弊社はその点に注目し、中国語の解析部分を一から作り替えました。その結果、機械翻訳精度が大きく向上しました。更に、ルールベース機械翻訳の手法のメリットを活かし、数字・量詞の表現をより正確にしました。

 

中国語機械翻訳品質向上例

<同じ漢字でも品詞が異なる>

中国語では同じ漢字を多品詞語として使うことがあります。下記にその一例を挙げます。

「输入」(入力)は名詞と動詞のどちらにもなりえます。改良前エンジンでは、どちらも動詞に解析していました。改良後エンジンは名詞と動詞それぞれ正しく解析できるようになりました。

他社訳では両品詞ともに正しく解析できていません。

原文 输入结果103具有基本信息显示区域50和输入区域104。
参考訳 入力結果103は基本情報表示領域50と入力領域104を備えている。
改良後エンジン 入力結果103は基本情報表示領域50と入力領域104を有する。
改良前エンジン 結果103を入力して基本情報表示領域50と入力領域104を有する。
A社 入力結果103は、基本情報表示エリア50と入力エリア104があります。
B社 入力結果103は、基本情報表示領域50、入力領域104である。

 

原文 然后输入结果中的文字。
参考訳 次に結果の中の文字を入力する
改良後エンジン その後結果中の文字を入力する
改良前エンジン その後結果の中の文字を入力する
A社 そして結果を入力した文字。
B社 そして、入力結果の文字が表示される。

 <同じ漢字でも意味が異なる>

中国語では同じ漢字が複数の意味を持つことが多いです。下記にその一例を挙げます。

「吹」には「吹く」、「別れる」、「膨らませる」などたくさんの意味があります。改良前エンジンは全て「吹く」と訳していました。改良後エンジンは主語や目的語によって最も適切な訳語を選ぶようになりました。

他社訳では正しく訳し分けできたところがありません。

原文 一上大学,她就和我了。
参考訳 大学に入学すると、彼女はすぐ私と別れました
改良後エンジン 大学へ行くと、すぐ、彼女は私と別れました
改良前エンジン 大学は、彼女はすぐ私と吹きました
A社 彼女が大学に行くと、彼女は私と一緒に爆破した
B社 大学に行ったとたん、彼女は私と一緒に吹いた
C社 上の大学は、彼女が私と吹きました

 

原文 了一个气球。
参考訳 彼は風船を膨らませました
改良後エンジン 彼は1つの風船を膨らませました
改良前エンジン 彼は1個の風船を吹きました
A社 彼は風船を吹き飛ばした
B社 彼は風船を吹いた
C社 彼は風船を1個吹いた

<中国特有の単位の翻訳に対応>

中国語には特有の単位が存在します。下記にその一例を挙げます。

中国の「一斤」を日本の単位に換算すると「0.5キロ」に相当します。改良前エンジンは正しく換算できていませんでした。改良後エンジンは単位の換算ができるようになりました。

他社訳は数字、単位ともに間違っています。

原文 三斤香蕉一共十块钱。
参考訳 1.5キロのバナナは全部で10元です。
改良後エンジン 1.5キロバナナは合計で10元です。
改良前エンジン 3斤のバナナ合計10元。
A社 バナナの3ポンドは合計10ドルです。
B社 3キロバナナ全体で10元。
C社 3斤のバナナは全部で10元です。

 

機械翻訳の品質向上の成果を検証するため、新エンジンの機械翻訳結果を「漢語水平試験(HSK)」で測りました。

HSKは世界で行われている中国語の検定試験で最も受験者が多い試験です。また、世界のどの地域でも適切な評価を受けることができるよう、CEFR(ヨーロッパ言語共通参照枠組み)という世界共通の基準に準拠するよう設計されています。他の言語検定と正当に比較ができるようレベル設定がされています[1]。 下記にHSKとTOEICの対照表[2] を示します。

評価方法:

HSK 4級保有者とHSK 6級保有者に、中国語の基本文法をベースにした文を翻訳してもらいました。その結果と改良前後の中日機械翻訳結果を自動評価ツールBLEUで評価。

BLEUとは、参考訳 (人間が与えた理想的な訳) との近さを測定することで採点を行うツールです。つまり、翻訳結果と参考訳との単語の一致度が高ければ高いほど評価値が高くなります。

評価結果:

改良後の翻訳精度自動評価値はHSK4級保有者とHSK 6級保有者の間にあります。従って、機械翻訳結果はHSK5級レベル相当の精度であると言えます。

下記に機械翻訳結果と人力翻訳結果の自動評価値の分布図を示します。

 

【今後の展望】

新中国語エンジンを搭載した製品は今年秋以降順次発売予定。

日中翻訳は、2020年のオリンピックに向けての翻訳需要の増加に対応できるよう、引き続き品質向上を図っていきます。

中日翻訳は、2019年までにHSK 6級レベル相当のエンジンを提供することを目標に開発していきます。

[1] “HSK中国語検定”、http://www.hskj.jp/about/、2017年12月28日アクセス

[2] “各種語学検定の難易度比較”、https://quadrilingual40.blogspot.jp/2017/02/cefr-b2.htmlhttp://www.hskj.jp/about/、2017年12月28日アクセス