
こんにちは、ディオゲネスです。
突然ですが、生成AIを用いて、日本語文書を英語文書に翻訳する機会がありました。今回は、生成AIを用いて翻訳業務を行う場合に、どんな工夫をするとうまくいき、またどんな注意点・苦労があるか、などについて得られたノウハウを、記憶の新しい内にまとめておきたいと思っています。
翻訳と一口に言っても、小説なのか技術文書なのか、文書の特性によって色々だとは思いますが、同じように翻訳を生成AIのサポートを受けながら実施する方たちの参考になれば、と思います。
(1)生成AIの翻訳の実力
私は、サイバーセキュリティ分野で仕事をしていて、比較的英語情報に日常的に触れる環境にいます。しかしながら、私は、いわゆる機械翻訳技術をこの20年ほぼ全く使っていません。私は英語の成績が良かった方ではありますが、選べるならば英語ではなく日本語で読み書きした方が3倍効率的です。
機械翻訳等に頼らなかった理由は、単にあまりにも出てくる日本語が意味不明なものだったからです。私と同年代の方は、今もIT業界の巨人である某社の機械翻訳丸出しの日本語ページが、いかにひどい出来だったかを覚えておられるのではないでしょうか。
ChatGPTなどの、LLMに基づく生成AIの登場は、そんな私の機械翻訳=低質という固定観念を打ち破りました。少なくとも私のレベル、用途においては、その翻訳は十分に実用に耐えるもので、もう英語を英語のまま読むメリットは消失した、と感じさせられました。自分の「スキル」が、ただの「趣味」に格落ちした瞬間です。
旧一万円札のモデルだった福沢諭吉は、オランダ語の勉強に青春を捧げ、「横浜に西洋人がいる」と聞きつけると、ヨーロッパの言葉(だと信じていた)、オランダ語が通じるかどうかを試しに横浜まで突撃しました。1859年、諭吉 24歳の時の出来事です。
結果は、「ハッハ、遅れているな、オランダの時代なんてとっくに終わってる、今はイギリスが覇権国家で、世界は英語で回ってるんだよ」と告げられてしまいます。
しかしさすがは福沢諭吉、すごいのはその後です。私なら1カ月はショックで落ち込みますが、その日のうちに、一から英語を勉強しなおす決意をしたそうです。
私たちも、生成AIで仕事がなくなることを心配するよりも、それをうまく動かす方法という新しい「言語」を、学びなおすべきでしょう。
話が大きくなってしまいましたが、実際に、翻訳業務を例として、生成AIを上手に使う方法、注意点を探っていければと思います。
【注】前提として、企業で文書の翻訳に生成AIを使うには、まずそのセキュリティを問題にする必要があります。
当社の場合、社内に専用の環境が用意してありますが、そうではない場合、所属する組織の規定等を確認するか、情報セキュリティ担当部署への確認を行うなどしてから活用するようにしてください。
(2)生成AI翻訳の下準備 ~キャラ設定をする~
生成AIをうまく利用するには、「役作り」をしてあげることが重要です。
今回は、「日英翻訳の先生」、「英日翻訳の先生」、「英語よろず相談役」の3つを用意して使い分けました。
といっても、チャットのモジュールを3つ用意して、最初に3通りの指示を与えるだけです。「役作り」指示をご紹介します。
役1:翻訳諭吉
あなたは、優れた翻訳家です。与えられた日本語について、ビジネス文書かつIT技術文書であることを踏まえ、正確に翻訳された英語を回答します。ただし、できるだけ平易な英語表現を選択し、直訳により難解になることを避けます。また翻訳文自体のみを回答とし、前後にコメント等はしません。
以後、翻訳対象の日本語を貼り付けるだけで、対応する英語文章が返ってくるようになります。
この「翻訳諭吉」は、私がこの役に付けた名前であり、実際にはそのチャットモジュールのタイトルです。指定した役が分かりやすいものを付けておくのが良いでしょう。
また、「ビジネス文書かつIT技術文書」という指定のところを更に細かくし、背景や分野を説明した方が関連する専門用語が正確に導かれると考えられます。
役2:もどし職人
あなたは、優れた翻訳家です。与えられた英語文章について、その日本語訳を示します。内容はビジネス文書かつIT技術文書であることを踏まえ、正確に翻訳された日本語を回答します。また翻訳文自体のみを回答とし、前後にコメント等はしません。
役1:翻訳諭吉による英訳は、もちろん、まず人間が読み、正しく理解できるか確認すべきです。その代わりにはなるものではありませんが、できあがった英文を、この「役2」に日本語に逆翻訳させることで、その妥当性を二次確認していました。
役3:英語先生
あなたは、日本人に英語を教える優れた英語の先生です。与えられた英語にまつわる疑問等について、正確に回答したり、添削依頼に答えたり、細かな文法ミスについて解説したりします。
役3:「英語先生」は、上述のような単純な疑問を尋ねたり、AIの英訳がピンとこない場合に、自前で考えた英文を添削してもらうことに主に利用していました。
この「英語先生」、実際には私が中学1年ではじめて英語を学んだ時、その面白さを教えてくださった英語の先生の名前を付けました。
こうやって、親しみの持てるお名前を拝借することで、色々な相談がしやすくなるのが案外生成AI活用のポイントなのかもしれません。
この3人、いや3体のアシスタントAIを配置し、翻訳を行いました。

※どことなく私ににている、アシスタントロボは指定にも関わらず一体になってしまった。
(3)生成AI翻訳の注意点
さて、あとはどんどん日本語を与えて、翻訳してもらい、内容を確認し、問題がなければ採用するということを繰り返せば翻訳は進んでいきます。
ただし、私が体験を通して学んだいくつかのコツや注意点、落とし穴があります。
①.同一単語の翻訳ブレの抑止
文書の中では、繰り返し出てくる用語があります。
たとえば、「調査」です。research, survey, investigation, inspection, すべて「調査」です。
生成AIによる訳では、こうした固定したい用語の訳にバラツキを産むことがあります。
これについては、固定すべき用語をまず決定し、それぞれについて次のように指定します。
今後、「調査」という日本語は、かならず "research" という訳をあててください。
こうした、訳語を固定したいケースは、他にも専門用語などで起こり得ます。ただし、分野を適切に読み取っていれば、専門用語もかなり正確に訳されます。そうでない場合に、上記のような指示による固定を行えば十分でした。
②.単数か複数かに気を付ける
「朝食にリンゴを食べた。」の英訳は、もちろん "I ate an apple for breakfast." だと言いたくなりますが、それは早計です。もしリンゴを2個食べた大食いの人の話なら、"I ate two apples for breakfast." としなければなりません。
日本語では、分量が問題になっているときでもなければ、いちいち「リンゴたちを食べた」などと、単複の区別を明らかにしたりはしません。この単複の区別がつかない問題は、生成AIが誤訳することが最も多いパターンでした。
最初の内は、手で直していたのですが、単数か複数か、生成AIには直ちに読み取れない名詞が主語になる場合には、動詞の活用も変わってしまいますから、修正作業ミスが気になります。そこで、下記のようなプロンプトを与えることとしました。
(このプロンプトは、いろいろと試行錯誤して、「比較的」上手くいったものです。おそらく、「入出力例」を与えたことが、AIの理解を促進したのだと思われます。)
##指示
今後、日本語表記から、それが単数であるか複数であるか読み取れない場合には、警告を発し、かつ両方の可能性を考慮した二通りの訳文を示すようにしてください。
以下に入力出力例を示します。
##入出力例
###入力
リンゴはニュートンの顔面に落ちる。
###出力
リンゴが一個か複数か読み取れません。
(1)単数の場合
An apple falls on the face of Newton.
(2)複数の場合
Apples fall on the face of Newton.
このプロンプトによって、そこそこ意図通り動作してくれましたが、忘れられてしまうこともありました。完全には解決しなかったものの、上記のような指示をしておくことで、作業はずいぶん楽になったと思います。
というのも、「指示を忘れていますよ、なぜ単数だと断言できるのですか?」と突っ込むことさえ忘れなければ、指示を思い出して正しい訳を出してくれるからです。

③.修飾関係が読み取れないケースに気を付ける
これは日本語表現に曖昧な点が残っていて、日本語の原文に改善の余地がある問題とも言えますが、そもそも2通りの解釈があり得る日本語というものがあります。
たとえば、「難解な数式の証明」は、数式そのものが難解なのか、数式は簡明だが証明が難解なのか、字面からは分かりません。
これについては、プロンプト指示でどうこうした訳ではなく、そうした文章に出会った時点で、都度気を付けるようにしていました。
ただし、この問題も実際に誤訳されることはかなり少なく、それまでの文章の流れから自然な解釈が推定できる場合には、殆ど間違えなかったと思います。
日本語はハイコンテクスト言語の代表だといいますが、「機械にコンテキスト理解は期待できない」というのは、過去の話なのかもしれません。
少なくとも、生成AIに対してはコンテクストやキーワードの共有をすればするほど、回答の精度や品質があがっていったように思います。
(4)終わりに
翻訳業務に生成AIを活用したことを契機に、生成AIを実際につかって翻訳を実施してみた結果得られた知見等を共有しました。如何でしたでしょうか。
私自身は、実際に業務目的で使ってみることで、翻訳という用途を超えて生成AIの特質が少しつかめたような気がします。好むと好まざるとに関わらず、この技術を上手に使うか、使えないかは差を生むでしょう。
生成AIをうまく使うためのヒントになれば幸いです。