TOP > IT・テクノロジー > Google翻訳より高性能? 「日本の自動翻訳がすごい理由」をNICT隅田氏が解説 (1/4) - ITmedia NEWS

Google翻訳より高性能? 「日本の自動翻訳がすごい理由」をNICT隅田氏が解説 (1/4) - ITmedia NEWS

85コメント 登録日時:2019-06-17 07:27 | ITmediaキャッシュ

国産翻訳エンジンを使った「みらい翻訳」が高精度だとネットで話題に。なぜGoogle翻訳より高精度といわれているのか。開発者のNICT隅田氏に聞いた。 (1/4)...

Twitterのコメント(85)

これとか読むと分かりますが

機械翻訳が人間の翻訳にかなわないのは文脈を理解できないから

機械翻訳と話の対象に詳しい人が分業したらプロ翻訳者と同じ仕事ができるなら、そういう取り組みがあってもおかしくない
でも、実際は分業すると同じクオリティは出せないのでしょう
「みらい翻訳」マジでお世話になってます。
あと、ポケトークもね!
想像よりはるかに単純な理由で驚き
AIが一文単位から文脈単位で理解するように進化するとかはないのかな。
ネオ・ラッダイト運動、お疲れ様です!!! /
笑っちゃうね。ま、Google翻訳に潰されまくった日本の翻訳事業の苦しい記事。みらい翻訳が生き残ってるのは口語ではなく法的文書関連のコーパスがあるってだけっしょ。コーパスの違いをあたかも技術の優位性のように語っちゃうのが末期っって感じ。
は日本のNICTの技術が使われているのか。
なら買ってもいいかな🤔
この前安くなってたのにさぁ😞
隅田氏は「学習データの質」に言及します。「学習データの質が高く、ニューラルネットワークが“自然な日本語”を学習しているからでしょう。逆に質の高いデータが少ないと、こんな簡単な文が翻訳できないのかと思われてしまいます」
余計な話が多すぎて、結局、何が理由なのか分からないまま記事が終わっている気がしますが、要するに、日英翻訳に特化して専門領域も絞っているから翻訳結果がよいということでしょうか?
堺筋線→サカイマッスルタウン(爆)
なぜNICTが自動翻訳エンジンを開発しているのかという話
みらい翻訳使ってみよう
これは良いなあ。現段階では実際に、明らかに高性能ですし。どうにか続いてほしい。>
今でもGoogle翻訳によくお世話になってますが、こういった技術がどんどん進歩すると助かります。
ちょっと試した。たしかに制度はすごいけど、スピードや利便性はウサギと亀状態。。。記事中にある通り、プロツールとしては良いのかもね。 →
「大阪メトロの英語サイトが路線名の「堺筋線」を「Sakai Line」と誤訳」そういう事があったんだw

「みらい翻訳」って仕組みを使ったアプリが ドコモから出てるのか
後でダウンロードしてみよう
正直、日英翻訳にGoogle翻訳は向いてないと思う。
英中翻訳は割といけるのだが(それが先日悪用されたようで、全く)。
これからのAIの話をしよう(自動翻訳編):
いくらすごくても使えないんじゃ無いのと一緒じゃん?
やはり分野特化で性能上げてるのか〉
でも,誤訳があって「おかしい」とつぶやいたりしても、その前にフィードバックくらい挙げているのかな?とも思う次第。あ、日本語→日本語の翻訳はいいかも。。。
■メモメモ。Google翻訳もちゃんと使えば悪くないけどね。固有名詞は、くくればなんとかなる。
恥ずかしながら、みんなの翻訳というサイトを知らなかった。早速試してみよう。
記事自体は面白かったけれど見出しは違和感あり。日本の自動翻訳が違うわけぐらいが妥当なんじゃね?>
日本語の特殊な文法や和製英語なども多いので、精度の高い翻訳は歓迎。Google翻訳よりも一般人に浸透するように期待。 /
日本人の感性は日本人にしかわからない↓
NICTのはまだできてないんだろうけど、既存の国産自動翻訳ツールとか鼻クソ以下で使い物にならんものばかりなんだけどねぇ……
このみらい翻訳の精度ほんとに高くてびっくりした
みらい翻訳を便利に使ってはいるんだけど、ガラケーとかTRONみたいなことになりそうな予感がしてる。。がんばって。 /
「学習データの質が高く、ニューラルネットワークが“自然な日本語”を学習しているからでしょう」
みらい翻訳は確かに凄い。あんまり使ってないけど笑
>Google翻訳のように大きくなり過ぎたサービスは、網羅性を重視するあまり地域ごとの強いニーズに応えられず、やがて小さなほころびが大きくなっていく

こういうとこを狙うしかないだろうな、と
専門分野に特化したデータを機械に学習させることが、機械翻訳の制度向上につながる。
VoiceTra頑張ってほしい。
// たちまちメモ。(明日読む…かもw)
日本語は特に複雑な言語だからね
他国の人がアルゴリズム組むの難しい /
POKETALKは、知人がタイ旅行した時、ツアー客に貸し出されてとても便利だったと言っていた。  :
Google Translateは「堺筋線」の訳をまだ直していないと書いてあるが,そもそも32K単語のsoftmaxでは語彙を増やせない疑惑(rare wordは分解して対処しているらしい)
ほほぅ。

ただGoogle翻訳でも、

日本語→英語に変換→それを日本語に変換→おかしい日本語かどうか確認する

という工程をやってみることで結構翻訳精度はあがります。

英語が出来ない人間の知恵ですw
みてる:
「将来、人は機械翻訳されやすい話し方をするようになる」にSFらしさを感じる。
いや、誤訳を放ったらかしにはしてないのだ。次のツイートを見てほしいのだ。
自動翻訳は、もはや、国家レベルで取り組んで良いと思うようになってきた。私の中で。

でないと、次第に、中途半端な翻訳が「正しい日本語」になってしまいかねない。
日本語を守るために。
仕事で翻訳する機会あったから使ってみたらGoogle翻訳によくある違和感が少なくてすごかった
読みやすい記事。

⇒ (3/4) - ITmedia NEWS
確かに、みらい翻訳の英和の精度は高いと思う。
和英については英語に訳しやすい文章を心がけた方が効果が高いと思う。
とりあえず主語のある短い文章にしとけば、まあ‥。
「NICTでは質の高いデータを大量に集めるために「翻訳バンク」というサービスを始めました。日本国内のさまざまな業界の翻訳データを蓄積し、特定の領域に特化した翻訳エンジンを生成するというものです」
商業化出来ないのに自慢するなよ、こんな余裕があるのが競争力がない理由、無駄なコストが払われている) / Discover(Google)から
確かに翻訳精度高かった。
ポケトーク の日英翻訳のエンジン、VoiceTraに代えてくれないかな?
JRの主要駅が変換できなかったりするから。いやそれ以前にJR東海が「ジュニアトウカイ」だし。
これからのAIの話をしよう(自動翻訳編):
引用;今後ますます自動翻訳のニーズが広がる中で、「あっ、私いま機械が理解しやすいような話し方をしたな」と意識する場面は案外すぐやってくるかもしれません。→普通に通訳使うときでも実は同じなのだが。
あとは、スラングをノイズ扱いするのか正規化するのかで、用途が決まってくるのかな。「He is a trap」をまともに翻訳できた試しはないしね
翻訳関係者必読です。
翻訳ツールの精度を高めるには各国おのおので取り組まないと実現できないんですね。◾️
時々使うけど、分かりやすい言葉で翻訳してくれるので助かる。/
NICTは収集した国内の対訳コーパスをベースにしてるから固有名詞に強いのは当たり前…Googleは基本統計的アプローチ。話者の母数が少ない日本語のインプットの少なさも影響ある。国内需要に対する目線が違うだけ /  「日本の自動翻訳がすごい理由…”
マスキュラーライン、バキっぽくて好き
ふむふむ。
「隅田氏によると、海外の特許訴訟費用の大半は翻訳費」 /
そいつはコトだ。 /
NICTのvoiceTraはぜひ一度使ってみてください。Google翻訳との次元の違いを体感できます。
国産検索エンジンから各社がことごとく撤退した当時には何も感じなかったのですが、その後にジワリジワリとボディブ...
読んでる。: "これからのAIの話をしよう(自動翻訳編):"
どうやら、みらい翻訳 が高性能らしい。 どのような仕組みだろうか。気になる。
Google翻訳の利用頻度はもちろん高いけど、思想が違うNICTの「みらい翻訳」も今後使っていくようにしよう。
「GoogleとNICTではそもそも考え方が .. 堺筋線の問題も、いまだに誤訳をしているってことは、そもそも直さなくていいと思っているわけです」
NICTのこの人達の研究対象ではないのかもだけど、機械翻訳はもうアプリケーションだとかいった範囲を頑張って翻訳こんにゃくバリのUXを実現するような方向も頑張ったほうがいいんじゃねぇかなと何年も前から思ってる。 /  「日本の自動翻訳がすご…”
"テレビCMでおなじみのクラウド型音声通訳デバイス「POCKETALK」や、Google翻訳より高精度だとネットで話題になった「みらい翻訳」にも、NICTの技術が使われています"
ローカルのことはローカルでやった方が精度が高くなるのは間違いない
おお、使ってみる
見てる:
google翻訳よりすごいってまじか。
API出てるのかな。
むしろ母国語を英語(グローバル語)に訳す研究何だから日本が最先端で有るべき。ガンバ! =>
Googleさまが日本と日本語に興味ないからでは… >
大阪は大体何をやってもネタで許されるからキャラ得

"「堺筋線」を「Sakai Line」と誤訳していたことがネットで話題になりました"
 "さすが大阪、ボケ方が半端ない"

Google翻訳より高性能? 「日本の自動翻訳がすごい理由」をNICT隅田氏が解説
堺筋線については、「堺筋線」が学習用対訳コーパスに入ってれば問題無かったと思われ、逆にこの路線の存在を知らない人間だったらどう訳しただろうかとか考えるに、機械翻訳ってどうあるべきなんぢゃろうねえ…
Bing翻訳が「堺筋線」を「Sakai Line」と誤訳したのが大問題になったのに、Google翻訳は今でも「Muscular line」 のまま。そんなツールを使わざるを得ない環境に対する反逆の物語を取材しました。
正直大事なのは、技術よりもUIや使いやすさ、マーケティングだと思っている。IT関係も技術ばっかりに力入れるから、いつも世界標準からずれてくる。

地図なんか典型だし
VoiceTraめちゃ使いやすくて便利
”堺筋線の問題も、いまだに誤訳をしているってことは、そもそも直さなくていいと思っているわけです”  (2/4) - ITmedia NEWS
以上

記事本文: Google翻訳より高性能? 「日本の自動翻訳がすごい理由」をNICT隅田氏が解説 (1/4) - ITmedia NEWS

関連記事