<第60号> 機械翻訳3
=-=-=-=-=-=-=-=-=-=-=-=-=-=
グローバル市場開拓 メルマガ
<第60号>
機械翻訳3
=-=-=-=-=-=-=-=-=-=-=-=-=-=
こんにちは
グローバル市場開拓メルマガ 発行責任者の牧野好和です。
ソフトウェアの開発でアジャイルとウォーターフォールはよく比較されます。
私の理解ではウォーターフォール型のプロセスでは、
要件定義の段階で仕様を固めているため、
設計や製造の段階ではその仕様を変更することができません。
仕様変更のためには要件定義からやり直す必要があります。
時代の変化が早い今、
開発の最中に仕様変更が生じることは避けられません。
そこで、オブジェクト単位で開発プロセスを管理する手法が発展しました。
オブジェクト指向では、万が一仕様変更が生じたとしても、
すべての開発を最初からやり直すのではなく、
対象となるオブジェクトのみやり直すことができるので、
仕様変更による開発全体への影響を最小限に食い止めることが出来ています。
一方、アジャイル型のプロセスでは、
要件定義・設計・プロトタイプといった一連の開発プロセスを
こまめに繰り返すことで、全体像として形のある製品を
ブラッシュアップしながら作り上げていきます。
アジャイルプロセスの場合、最初に作り出される製品は、
完成度が低くても、ユーザーの声を受け入れながら、
完成度が高まっていきます。
さて、そもそもアジャイルのプロセスは、
ソフトウェア開発だけでなく、モノづくり全般を対象としています。
そして、近年はこのアジャイルの考え方の重要性が高まっています。
例えば自動車。
テスラは市場にすでに販売した自動車から
ユーザーが実際に運転しているデータを収集し、
そのデータを自動運転のためのデータとして活用しています。
もし自動運転車をウォーターフォール型のプロセスで
開発していた場合、社内で試験運転したデータしか集まりません。
しかもいつその製品が市場にデビューできるか分かりません。
デビューした時に、ユーザーに受け入れられるかも分かりません。
テスラの場合、電気自動車という、それだけで画期的な製品を、
高級車という路線で一部の先進的な人をターゲットとして販売し、
かつその購入者と夢を共有しています。
そのため、購入者から広範囲な運転データを入手することに成功し、
自動車運転という次世代の技術のためのデータ収集において、
他の企業よりも大きく先を進んでいます。
これこそが、アジャイルプロセスの強みと言えます。
アジャイル型で市場に出した場合、
それが先進的な製品であれば、必ず尖ったものが好きなファンが、
評価をしてくれます。厳しい評価を受けたとしても、
迅速に改善していけば、その厳しい評価をしてくれた人自身が、
「自分のおかげ」とロイヤルティを感じてくれて、
ファンになってくれます。
逆に、市場の声を製品に反映できなければ、
アジャイルプロセスで開発した製品は
市場に受け入れられないことになります。
アジャイルプロセスは、あらゆるプロセスの中でも、
難易度の高いプロセスですが、
オープンイノベーションが求められる今
不可欠なプロセスになりつつあります。
さて、今号の内容です。
><><><><><><><><><><><><><><
<第60号>
機械翻訳3
><><><><><><><><><><><><><><
機械翻訳を考える上で、以下の3つの視点が重要です。
1)ITとしてのテクノロジー
2)AIとしてのテクノロジー
3)資産としての対訳データや用語集
グーグル翻訳を使ったことがある方は多いと思いますが、
例えば左側に日本語を入力すると、右側に英語が表示するといった機能は、
ITとしてのテクノロジーになります。
近年はテクノロジーが進み、ワードファイルなどファイルを丸ごと
機械翻訳することができるようになっています。
さらにはPDFをOCRでワードに変換して機械翻訳をすることも
できるようになっています。
これらも、ITとしてのテクノロジーと言えます。
りんご →Appleとして翻訳するためには、
インプットとアウトプットを結びつけるアルゴリズムがあれば、
機械が出力することができますが、
文脈の意図に応じたアウトプットをするためには、
学習が必要です。
例えば、「今日はいい天気だ」という文章を英語にする場合、
通常は「It is」で始まり、「today」で終わりますが、
単語の対比だけでは「Today is」から始まるでしょう。
そのため、AIに、一つずつ用例を覚えさせていき、
最終的にAIが自分で判定できるようにしていきます。
これが、2)のAIとしてのテクノロジーです。
ただ、2)のAIとしてのテクノロジーのためには、
豊富なデータが必要です。
そして、データが間違っていれば、いくら優秀なAIでも、
間違ったアウトプットをしてしまいます。
このAIのテクノロジーで重要なのはセキュリティです。
AIエンジンの性能はどんどん高まっていますが、
AIが覚えるためのデータをどのように管理しているか?
という点については、性能とは別にしっかりと確認する必要があります。
そして、ITとしてのテクノロジーとAIとしてのテクノロジーは
発展し、オープンになり、汎用化されていますが、
3)のデータの部分に関しては、これまでも、これからも、
最も重要な論点となります。
機械翻訳のデータに関しては考え方は大きく二つに分かれます。
高い精度を求めるならば教師データは多ければ多いほどよいです。
その一方で、翻訳結果は無難になっていきます。
例えば、業界特有の表現など、「分かる人にだけ分かれば良い」という
表現は、機械翻訳からはアプトプットされににくなります。
そこで、ある程度文脈の分かり難さが残ったとしても、
業界特有のデータをアプトプットさせることを重視する方法もあります。
近年では自動車業界や医療業界など、業界特有の強みを持った
AIエンジンをカスタマイズするといった事例もあります。
今、機械翻訳はグローバル展開を進めるにあたって
不可欠なソリューションになってきています。
情報収集する際に、上記の3つの視点を念頭において、
検討すると、使ってから「こんなはずじゃなかった」
を避けることができます。
本号の内容は以上です。
来週もよろしくお願いいたします。
メールマガジン「グローバル市場開拓」
☆発行責任者:牧野好和
☆公式サイト:http://www.japan-product.biz/
☆登録・解除:http://www.mag2.com/m/0001687506.html