最新情報をお届け
メルマガ登録はこちら➔

インバウンドコラム
機械翻訳とSEO

2020年09月17日
キャンペーン

進化と限界

  GPT-3 (Generative Pre-trained Transformer 3)は、「1750億のパラメータ(変数)を持つ自己回帰型言語モデル」で、機械学習のために、Webサイトから数年にわたり収集した1兆語におよぶデータセットを使用し、英単語や短い文章をインプットすると、関連する「それらしい」テキストを自動生成するツールです。(参照※1)登場以来、もしかしたら、GoogleのSEOでも使えるのではないか?と話題になっていましたが、GoogleのGary Illyes 氏がツイッターで、「機械翻訳されたコンテンツはインデックスしない」と投稿しました。(参照※2)ディープラーニングの機械翻訳は、確かに日進月歩ですが、まだまだ未完成な技術です。例えば、「Honesty doesn't pay.(正直者は馬鹿を見る)」ということわざですが、精度が高いと評判のDeepLで翻訳してみると、成句であればきちんと翻訳してくれますが、否定形を短縮しない形にするなど、少しでも変わると、「正直者はお金を払わない」と逆の意味に翻訳してしまいます。(参照※3、図1)さらに、いかにも「それらしい」日本語訳を出力するので、誤訳や訳漏れにとても気づきにくく、翻訳者界隈では、「絶対にこんなの校正したくない」と戦々恐々としています。

機械翻訳の限界について

※1 新AIツール - ITmedia ビジネスオンライン
https://www.itmedia.co.jp/business/articles/2007/29/news025.html
※2 機械翻訳はNG - SEO Round Table
https://www.seroundtable.com/google-machine-translated-content-29957.html
※3 DeepLの実力を見よ |@TNK_KNCH
https://twitter.com/TNK_KNCH/status/1302540714731945984?s=20

最新のコラム

Contact us

お問い合わせ

少しでも不明点等ございましたら
お気軽にお問い合わせください。

※こちらからの営業目的の連絡はご遠慮ください。

アウンコンサルティング株式会社が提供するサービスについて、資料請求、お問い合わせをお受けしております。
必要事項ご記入の上、「確認画面へ」ボタンを押してください。

Top