AI翻訳が第3世代へ(前世代までをおさらい)〜同時通訳者の脅威になるのか〜

AI翻訳が第3世代へ(前世代までをおさらい)〜同時通訳者の脅威になるのか〜

 後で見る

英語を入れてボタンを押すと、その日本語訳が瞬時に現れる自動翻訳ツール。以前は少し長い英文を入れると、日本語ではあるけど、日本語として意味をなさない訳語が出て、思わず笑ってしまうことがありました。

その自動翻訳(機械翻訳)の精度がAIのおかげで向上し、今は文章単位だけでなく、例えば英語で書かれたDOCやPPTなどのデータを、AI翻訳ツールにアップロードすれば、日本語の文書データとして生成することまでできるのです。

【合わせて読む】

AI同時通訳技術が一般解放された時にできること/できないこと
【ユーザー数25億人の中国SNS】WeChat,QQ,Weiboが世界の頂点に立つ日。
欧米プロモーション手法コピペは、日本でほどんど受けない。欧米本社を逆教育しよう。

自動翻訳で言葉の壁をなくすことで、海外企業との国境を越えたプラットフォームビジネスが楽に展開できるのはもちろんのこと、日本で働く海外の人材とコミュニケーションがとりやすくなることで、仕事も円滑に進むもの。

AIを活用した第3世代の翻訳アルゴリズムが登場し、ユーザーごとに翻訳手法を設定する取り組みが進んでおり、5年後にはAI翻訳が同時通訳並みのレベルに達するかも?と言われています。

果たして5年後には翻訳者や通訳者という職種がなくなってしまうのでしょうか。

AI翻訳の進化

AI翻訳の進化

まず最初に第三世代に至る迄の、AI翻訳の歴史を紐解きましょう。

第一世代

2016年に米グーグルが深層学習(ディープラーニング)を活用した、ニューラル(機械)翻訳をインターネット上で公開。それに連動するかのように米マイクロソフトや、日本で情報通信分野を専門とする唯一の公的機関である情報通信研究機構(National Institute of Information and Communications Technology=NICT)も、ニューラル翻訳を相次いで採用したのです。

第一世代はディープラーニングの一種である、再帰型ニューラルネットワーク(Recurrent Neural Network=RNN)を使ったもの。RNNにより一文ごとの翻訳が可能となり、手書き文字の認識や、音声認識への応用にいたる見通しができました。

それ以前は大量のデータから作った統計モデルを用いた統計翻訳が主流でしたが、ニューラル翻訳により、翻訳精度が飛躍的に向上したのです。

第二世代

2019年に普及したのが、トランスフォーマーと呼ばれる第2世代の翻訳アルゴリズム。トランスフォーマーでは単語の翻訳結果を決めるとき、その前後のどの単語に注目すればよいかを考慮する、注意機構 (Attention) というAIの仕組みを取り込んでいるので、一文ごとだった第一世代を大きく超え、文脈を考慮した一文単位での翻訳ができるようになりました。

2017年にAI翻訳サービスに参入したドイツのDeepL(ディープエル)も、第2世代のアルゴリズムを採用したことで、難解とされる日英間の翻訳が、グーグル翻訳に匹敵する翻訳精度を提供するまで成長。

第三世代

NICTが第三世代の翻訳アルゴリズム開発を進め、2020年秋にリリースする見込みです。その詳細について公表はされていませんが、訳文の品質は人が行った翻訳の模範例と比べても、大きく劣ることがないとのこと。

その他のAI翻訳の主要ベンダーでも、2021年までには第三世代アルゴリズムに切り替えると予想されています。次に第三世代アルゴリズムに対応した、各社の取り組みを紹介しましょう。

大量データ

翻訳の精度を上げるためには、AIに学習させる日英など対訳データを、大量に集めるのが極めて重要です。NICTは翻訳システムの使用条件を優遇する交換条件として、2017年対訳データを企業が提供する「翻訳バンク」事業を、総務省とともに開始することを発表。

これまでトヨタ自動車、製薬大手のアストラゼネカ、SMBC日興証券、日本取引所グループなど70を超える企業・団体と提携しています。NICTの目標は、1億文規模の対訳データを集めること。

カスタマイズ(企業や業務の種類単位で、翻訳システムを最適化)

グーグルは無料ツールのグーグル翻訳を提供するかたわら、同社の戦略分野であるクラウドサービスのAutoMLで、ユーザーごとに翻訳機能をカスタマイズするビジネスに注力しています。

日本の翻訳システム開発のロゼッタでは、ユーザー別にカスタマイズ機能を強化した翻訳システムを発表し、過去の訳文を再利用する翻訳メモリーの機能を、独自開発のアルゴリズムで改良。その結果単語・用語だけでなく、文体や言い回しのレベルのカスタマイズまで可能にしました。

音声翻訳

NICTのスマートフォンなどで利用できる、31言語に対応した音声アプリのVoiceTraが先行。これを利用したのがソースネクストの自動翻訳端末、ポケトーク です。双方向音声翻訳専用機(モバイル型)累計工場出荷台数が、2019年11月に世界第一位になり、今では日本全国の警察で5万台を配備。

ロゼッタは飛島建設と建設業界向けの装着型システムe-Senseを共同開発。これは建設現場などで音声認識により、日本人作業者が外国語で指示を受けたり、また外国人労働者とコミュニケーションをとりながら円滑に作業を進めるのに役立つものです。

アップルではiOS14で日、英、中、アラビア語など、11か国の多言語間の音声翻訳アプリが搭載され、音声やテキストによる会話をオンラインでもオフラインでも素早く翻訳。

同時通訳

NICTなどが参加した、総務省のグローバルコミュニケーション計画2025が開始。5年後には実用レベルの同時通訳のシステムを発表予定とのことです。

セキュリティ

DeepLでは、機密文書に求められるセキュリティを配慮した有料版をリリース。

AIにできないことが

AIにできないことが

格段に進化したといわれるAI翻訳。今後AI翻訳の能力は、どこまで生身の翻訳者あるいは通訳者に近づくのでしょうか?

翻訳の場合

専門家の見解では、中学生レベルの英語翻訳ならば、AIで十分に対応できるようになり、たとえば特許文書や法律、論文など記述のルールがある程度定形化している文書ならば、AI翻訳の精度は、かなり高いレベルに到達するとのこと。あるいは文書を作成した人がAI翻訳を使うことを意識して、抽象的あるいは文学的な表現を使わずに書いたものでも、翻訳精度はさらに高くなるでしょう。

しかしAI翻訳が役に立たない分野がまだ存在します。それは小説やシナリオなどの翻訳です。同じ単語や文章でも、対訳が一位ではないのが日本語のやっかいなところ。英語で自分を指すことば「I」だけですが、日本語の場合には老若男女、住む地方によっても異なるのです。

さらには前後の文脈で使える言葉が複数存在し、どれを使うかは翻訳者の腕の見せ所といえます。その微妙なニュアンスを人間の感性並みにとらえて、文章全体をなめらかな翻訳文にすることは、AI翻訳ではまだ難しいといえます。

例を挙げてみましょう。ある文章中に登場する女性(であるはず)を、AI翻訳が「彼」と誤訳。間違えた理由はその人物の職業がトラックの運転手で、その職業は一般に男性が就くことが多いことから、AIが「その職業の場合には男性形で訳す」という誤った学習をしていたからです。つまりAIがすでに学習したことから得られた(翻訳の)結果は正しいとは限らず、修正は当然熟練の翻訳者しかできません。

AIが行った下訳を翻訳者がリライトするというのが、現在の標準形。翻訳者が職を追われることはまだ先の話と考えられます。

同時通訳の場合

AI翻訳で行う通訳の中でも、特に同時通訳の現在の精度は低いといえます。まず人が発した音声をテキスト化した上で、翻訳という作業となるため、テキスト化と翻訳という2つの関門があるので難しさも倍増するのです。音声認識技術の進化で以前に比べたらテキスト化の精度は上がっているのですが、問題はやはりテキストから翻訳することといえるでしょう。

話し言葉というものは、書き言葉に比べて非常に粗いのが通常です。日本語では主語がない場合がほとんどで、さらに言葉が抜けたり、語順が変だったり、口籠ったりで、最終的には文章として体をなしてないこともあります。もっとも人間どうしの会話なら、口調や表情からほぼ正確な意味を捉えることができるので、話し言葉が文法上正しくなくても、大きな問題になりませんが、このようなことができるAIが登場しない限り、同時通訳の精度が上がることはないでしょう。

また同じ会話であるはずなのに、状況次第では誤解が生じる可能性がありますが、同時通訳者は、そうした微妙なニュアンスも汲み取って通訳ができるのです。語学力のみならず、コミュニケーション力があるからこそ。

こんな話もあります。身振り手振りの意味を伝える技量も求められることが。たとえば英語圏の人物がよくやることで、話しながら両手の人差し指、中指、親指で挟み込むようなジェスチャーをしたら、クオーテーションマーク(“ ”)で単語を括った、というニュアンスがあることから、その様子を見たら同時通訳者であれば、すぐに「いわゆる」という言葉に置き換えるそうです。これもテキスト情報だけに頼るAI翻訳が、代わりを務めるのが難しい点でしょう。

概して言葉というものは、使われている国の文化に根ざしていますし、言葉は文化だと言う人もいますよね。だからこそ同じ言葉、同じ会話だとしても実際に人が受け取るニュアンスが国によって違うことも多いので、同時通訳者でも誤訳することもあることも少なくないのです。ジョークなどもそうですね。そのまま訳しても面白さが伝わらないことがほとんどなので、通訳者の機転の見せ所になります。

このような各国の文化的な背景まで考慮に入れていない現在のAI翻訳エンジンでは、このあたりの訳し分けをすることが、今の所不可能といえるのです。

今後の展望

今後の展望

AI翻訳の精度が着実に上がっていますが、我々人間が多くの情報を用いて、複数の角度から言葉を使いわけていることに今更ながら気がつきます。AI翻訳にとって細かいニュアンスの理解は不得意のまま。テキスト翻訳ならまだしも、特に日本語が関係する通訳に至っては「もっともっと頑張ろう」のレベルでしょう。

日本では総務省が旗振りをして、2025年にAI同時通訳の実用化の目処を目指しているので、いずれは技術の進化で、人のレベルに近しいところまで到達するのかもしれませんが、少なくとも当面は無理むずかしいといえます。現在のAI翻訳のあるべき姿は、多少の間違いがあることはあらかじめ容認して使う、または下訳に使い、その後人の手でリライトすることでしょう。

しかしながらAI翻訳は、人に比べてコスト効率が圧倒的に高く、少なくともコミュニケーションの助けになるのは否めません。来年のTOKYO2020(実際には2021年になりますが)では、海外ゲストとの会話のきっかけ作りを、AI翻訳が提供してくれることも大いにありそう。

AI翻訳は道具(ツール)なのですから、それが便利かどうかは結局、人が決めること。人の生活を侵食するようなツールはいらない。いつの日か各国の文化や、言葉のニュアンスまで読みとるAIが登場すれば、人にとって重要なツール(パートナー)になりえますが、あくまでも人がいてこそのAI翻訳ではないでしょうか。

«

»

 後で見る
OFFCOMPANY スタッフ

この記事のライター

OFFCOMPANY スタッフ

 JOIN US
OFFCOMPANYへ参加する


もっと表示する