スマートフォンをはじめ、音声認識の技術はますます身近になっています。それと同時に自動翻訳機能は進化を続け、その精度が高まっています。かつては不自然な文章になることが少なくありませんでしたが、今では違和感のない形で翻訳されるようになってきました。
AIが言語を認識するための方法も進化しているので、いずれは世界中の人と、言語学習や通訳なしで会話ができる日が来るかもしれません。
そんなリアルタイム翻訳と音声認識技術の今を見ていきます。
スマートフォンをはじめ、音声認識の技術はますます身近になっています。それと同時に自動翻訳機能は進化を続け、その精度が高まっています。かつては不自然な文章になることが少なくありませんでしたが、今では違和感のない形で翻訳されるようになってきました。
AIが言語を認識するための方法も進化しているので、いずれは世界中の人と、言語学習や通訳なしで会話ができる日が来るかもしれません。
そんなリアルタイム翻訳と音声認識技術の今を見ていきます。
スマートフォンやスマートスピーカーに話しかけると、知りたいことを検索できたり、家電を好きに操作できたり。いまや機械とおしゃべりをする感覚で、日々の用事をカンタンに済ませられようになりました。これを実現したのは音声認識の技術と、音声アシスタントと呼ばれるAIです。
AIは、人のしゃべる言葉をテキストデータにしたうえで、意味を理解します。学習方法は「ディープラーニング」といい、まさに人間の脳細胞が学習していく方法と同じ。しゃべる言葉と出力側の“答え”が正しくなるルートを見つけ出せるまで、人の声を何度も聞いて「あいうえお」を判別していき、その次に単語や文節を聞き分けていきます。これらが辞書として登録されていくことで、やがて言葉の意味を理解するようになります。
これらの音声認識ができれば、AIアシスタントだけでなく、たとえばあなたがしゃべった日本語を別の国の言葉に翻訳する、といったこともAIにとって難しくありません。
☆あわせて読みたい
・驚愕の事実!こんなこともできちゃうの?ジェネレーティブAIが今できること
・最新音声技術とAIとメタバースで英語学習に再挑戦?!
音声認識技術の向上で進化したのが、リアルタイム翻訳です。いまや文字を打ち込まなくても、音声入力で好きな外国語に翻訳できるアプリがあります。スマートフォンに話しかけるだけで、即座に翻訳した文章が表示されるので、外国人同士がその場で会話することも可能になるでしょう。
またリアルタイムに翻訳した言語を、音声合成によって自ら発音してくれるので、画面を見ずとも会話が成立します。語学が苦手な方にとっては、まさに頼もしい通訳をポケットに入れて連れ歩くような感じですね。翻訳精度の高まりによって、海外旅行やビジネスシーンにおいても外国人とスムーズに意思の疎通ができるようになります。
ただ現時点ではまだ、AIの性能によって翻訳の精度が劣るものもあります。翻訳精度を向上させるためにはディープラーニングがより多く必要となりますが、現在この学習方法自体に革命が起きつつあります。
☆あわせて読みたい
・リアルタイムボイスチェンジャーの用途は配信だけにあらず!置き配、防犯対策に
・サービスや家電が自分好みに パーソナライズでスマートライフ、何がどう変わる?
機械翻訳による文章が時として意味不明になるのは、ひとつの単語には実に多くの意味があるため。ひとつの単語が文章の中でどのような意味を持つのかは、文脈の中でその単語が担う役割によって決まりますよね。
たとえば「はし」と口に出して言ってもそれが「橋」なのか「箸」なのか、あるいは「端」なのかが単独ではわかりません。でも「はし」に加えてもうひとつ「あるいた」と口にすれば、そのふたつで「橋」か「端」のどちらかを「歩いた」と推測できるはずです。
機械翻訳の精度が向上したのは、このように単語が増えるごとにひとつの単語の意味を特定していく方法、「RNN(リカレントニューラルネットワーク)」という反復学習を使うようになったからです。「橋」と「箸」の違いを、まぐれではなくて正確に理解するので、利用する我々は「この機械は賢い!」と驚いてしまうのです。
この学習方法はさらに進化し、現在「Transformer(トランスフォーマー)」という仕組みが活躍し始めています。Transformerは単語一つひとつを他の単語との関連性で判断するのではなく、文章全体をいっぺんに分析します。
先ほどの例で言えば、文章全体を俯瞰して聴いたうえでまず最初に「歩いた」という動詞に注目します。これに関連する単語として「はし」を見つけ、「橋を歩く」と理解します。このように発音された単語の順番で意味を理解するのではなく、文章全体を見渡してスマートに意味を特定させていくのがTransformerの仕組みです。
このようにAIは学習のロジック自体を進化させています。今後機械の性能が増し、ビッグデータも蓄積されることでますます自然な形で文章を理解できるようになるでしょう。
☆あわせて読みたい
・AIに人格が?ディープラーニングの賜物か?アーカイブがなせる業か?
・アーカイブとは何か? 故人を生き返らせるライフログやAIチャットボット
音声認識技術の向上により、リアルタイム翻訳も可能となりつつあります。さらに人工知能が学習することで、将来的には機械との複雑な会話が楽しめるようになるかもしれません。
☆あわせて読みたい
・対話型人工知能とは?音声アシスタントとは違う、対話型AIの可能性を読み解く
・推し活でセロトニンが分泌?!人気キャラクターを応援する「推し活」のススメ
・いまさらだけど「投げ銭」って何?推しを育てる推し活の広がりとは
・VTuber(ブイチューバー)の海外シーンの現状とは。日本とはどう違う?
・文化的な影響を受けて独自の進化を遂げる、テクノロジーとカルチャーの関係性
〜〜〜〜〜〜
ユピテルの「Juno(ユノ)」は、音声認識技術によって楽しい会話を楽しめ、生活に癒やしを与えてくれるネコ型のバーチャルペット。また見守りロボット「ユピ坊」も、最新のアップデートによって音声認識技術による会話が楽しめるようになりました。音声認識技術による機械との会話を楽しむことは身近になってきています。
(2021.9.16追記)また新発売のレーザー&レーダー探知機「Lei05」も音声認識に対応。美少女キャラクター「霧島レイ」がドライバーに向かって話しかけ、それへの返答によってキャラクターの好意度がアップするなど、車内でも楽しいおしゃべりができます。
「Lei05」ブランドサイトより
(2021.12.20追記)また同じく「霧島レイ」が登場するバーチャル×フィギュア「LVR-01」も新登場。やはり音声認識に対応して会話が楽しめるだけでなく、エアータッチセンサーの搭載により(非接触ながら)画面に浮かぶレイと指先で触れ合えるというプロダクト。音声認識の先をいく、最先端バーチャルコミュニケーションを体感してみてください。
☆あわせて読みたい
・愛されキャラの法則。人気キャラクターが長年愛される理由とは!
・塗装じゃないのよ痛車は!フロントガラスは厳禁!痛車ステッカーの秘密と作法
・爆アゲ痛車イベント!レイヤーも集うエモーショナルな会場での初心者の心得
・痛車で夜のドライブ!人気キャラクターが“魅せる!“映える原作聖地の夜
・萌えキャラ、きもかわ、ゆるかわ!人気キャラクターたちのグッズがデジタル化?
・連れていける推し、一緒に楽しむ推し。いつも「ぬい」とともに!ぬい活で推し活
LIFESTYLE
猫のいる生活には癒しと楽しさがいっぱい。実際に猫を飼う人は増加傾向にあります。と言っても、誰もが今す...
TECHNOLOGY
「3Dホログラム」が、いよいよ身近なテクノロジーになりつつあります。すでにサブカルチャーの世界では、...
CULTURE
動画配信サイトYouTubeに動画を投稿するインフルエンサー達が「YouTuber」として注目されて...
TECHNOLOGY
VTuberやゲーム配信者などに活用され、大活躍のリアルタイムボイスチェンジャー。様々なエフェクト(...