TOP > IT・テクノロジー > AIで日本史研究者やマニアが狂喜乱舞する「くずし字」の翻訳ツールが開発 - PC Watch

AIで日本史研究者やマニアが狂喜乱舞する「くずし字」の翻訳ツールが開発 - PC Watch

325コメント 登録日時:2019-07-11 12:28 | PC Watchキャッシュ

 Googleは都内のオフィスにおいて、「Solve....with AI」というアジア太平洋地域の記者などを集めたイベントを開催し、Google Cloud Platform(GCP、Googleのパブリッククラウドサービス事業)などを通じて提供している各種のAIサービスやTensorFlowなどの機械学習(マシンラーニング)ベースのAIを開発するツールなどのソリューションや、その...

Twitterのコメント(325)

「達筆すぎて読めない」もきっと読めるんだろうな〜〜
NTTとかがやってなかったかと思ったら案の定当初は言葉が足りてない記事だったみたいだ
@yatanavi
このニュースは「翻訳→翻刻」含め、丁寧に訂正されたんだけど、
「くずし字を現代語に推論できるシステム」
は訂正されていない。文脈から、多分「現代文字」の入力ミス。
人間が書いた崩し字が、AIにしか読めないのもどうかと思うが..
@tkasasagi さんの活動をGoogleの「Solve....with AI」の以下のニュースで知りました(私は書道団体を運営してます)。
研究者による「明治時代に印刷システムの要求から筆記体のくずし字から現代語への転換が図られた」の見解は初です。
ありがとうございます。
くずし字の解析ってjavascriptの計算力で足りるのか。
そもそもやってることは画像文字認識だから特徴検出に必要な計算リソースはそこまで多くなくて、くずし字は隠れマルコフモデルの調整にめちゃくちゃ手間がかかるとかなのかな。
どんだけ訂正してるんだ🙄
えっえっ、そんなことできんの課題すぐ終わるじゃんどこで手に入んのこれ(狂喜乱舞)
これは実用化されたらありがたいなー。自分で読めるようになれって話ではあるんだけどね。
にしても記事の訂正多すぎワロえすぎてワロエナイ。
これはありがたい!
夢のAI、でいいんですよね、先生。『AIで日本史研究者やマニアが狂喜乱舞する「くずし字」の翻訳ツールが開発される』
ついに、、笑
こうなるのは分かってたが、大学のゼミで四苦八苦しながら読み込んでいた日々を思うと複雑な気持ち、、笑
@pc_watch
江戸時代の翻訳が出来たなら「現代語のくずし字の翻訳」も出来るようにならないか?老人達の字が達筆過ぎて読めんなだ。「手書きは気持ちが入る」と言って、PC入力を拒否するのだ
大学の国文科に入って、まず最初に苦しんだのがこの変体仮名の解読だった。変体仮名集を片手にとにかく毎日読んで覚える繰り返し。今はもうほとんど忘れたけど。
へぇーこれは面白い発見。ばあちゃんが習字の達人過ぎて、身内でも確か読めないものが結構あったはず。これで読めるようになるのかも?🤔
ところで、今翻刻できるのは、いつの時代の「くずし文字」なのだろうか?→
草書も行書もある程度読めるケド、多少でも癖字になると一気に難易度上がンのよね。
フルオートで解析できるなら凄すぎるわ……汗
読めたら、面白そう。(・∀・)今度は、文として分からないとか?
第1報は誤解があったようで、訂正続出だけど、この記事自体は極めて画期的。
なんということだ! 俺が不勉強で読めない文字をAIが読めるなんて! ドカドカ読ませたら「あれにはこう書いてあるがこれにはこうある。総合的に判断するとこれが正しいだろう」とか、他の事実を突き合わせるとあの和歌の作者は誰々だ、とか解明されていくのだろうな
まじですかい 😱💓※学生時代読めるようになつために、ノートにたくさん解読したのをまとめていたけど ☞
「ディープラーニング(深層学習)の手法(U-Net)を活用し、国文学研究資料館が持つくずし字のデータ(日本古典籍くずし字データセット)を学習させて、くずし字を現代語に推論」
すばらしい。でも、これでくずし字を読める人がますます少なくなって、人間の判断が必要な変換誤りや曖昧な箇所について判断出来る人が居なくなるかも。
物樹さんが中途半端に間違ったことを書いてしまった所為で自分が触れざるを得ない気がしたので一応。
この記事、単純に凄いツールだと思います。ぶっちゃけ翻刻研究ってかなり時間が掛かる割には研究分野によってはあまり実績にならないし。続
すげーな
やったあーーー!狂喜乱舞する人間がここに!字が読めさえすれば意味は解るんだよ!これカメラでリアルタイムに読めるようにしてくれると美術館とか博物館ですごい便利。
骨董品の木箱に書いてある謎の崩し文字が判読出来るかも!
掛け軸とか。
欲しいな
大学で4年間古文書に苦戦したのが、わずか2秒!
『撮影したくずし字の古文書などにOCRをかけ、現代語に置き換える。1ページの置き換えにかかる時間はわずか2秒』
うわこれ欲しい!
古文書死ぬまで読みまくりたい!
これって正しいAIの使い方だよなあ。。
これはすごい。昨年の台風で実家の離れを壊したとき、曽祖父や曽祖母の書いたものが読めずにいるのをこれで解読できるかも
三箇所赤訂正入るくらいに難しいことと私は想像しました。素晴らしい。👍
これ、PRMUのアルゴリズムコンテストとはどう関係してるんやろう?
素晴らしい!でも、こんな「当たり前のこと」をなぜ「日本人の研究者」が実現できなかったのか推して知るべし😅
何ヵ所も赤字でお詫びして訂正しますって書いてあるのも象徴的よね…
課金してでも欲しい!古文書を読む速度が上がり、正確性も格段に増す。しかし、わずか百年たらず前の文字が読み書きできなくなってしまったというのか…
色々訂正が入ってる記事だけど、ついでにいうと識字率のくだりは0.01%以下ではなく0.01%未満だと思う。
これは面白い。
尚、文中にもあるように、翻訳というより翻刻やね。
歴史が変わるレベル!!
変体仮名、とにかくたくさんの字を見て脳と目を慣らさないとむつかしいものね…。すばらしいツールが開発されたものです
くずし字というか変体仮名が読めるようになりたくて、フランス文学科を卒業後、某大に社会人入学した身としては興味津々。でも、現代語訳じゃなくて、「翻刻」なんですよね。まずは印刷されているものから、ってことですね。
とうとう出てきたぞ。時代がすげえ
これはアツい♪ヽ(´▽`)/
細かいツッコミがたくさん入ったことを思わせる文章
これ、マジですごいと思う。
歴史が変わる。
kuronetスゴい!
素晴らしい!
Googleは関係なかったか。あとは、どれだけサンプルを取り込んで精度を上げられるかですかね。現状のパーセンテージはあまり参考にならない。 / “
☆これはいいな。
書道やってた訳でもないし、大学は(学力が著しく足らず)行けなかったし、ましてや理系だったし、素人が独りで日本史にハマるには確かに高いハードルだったもんな。
こんなものを使うと、一生草書体が読めない。
しかし、いまも読めないから、使った方がいいのかな。。。。??
すごい!:
すごい! →
AIの活躍する例
Discover(Google)から
林真理子さんが資料が読めなくて困っていたら編集者のお姉様方が翻訳をかって出た、という話がありましたね。マニアックだけど本当に貴重な知識。
これと漢文を翻訳するツールがあったら、高校時代の和算研究はもっと捗ったであろうなぁ。
すげーな。
何百年後、ggrks とかなんの略なのかわからなくて、解明されるツールが出来るかもw
おぉっ!面白い
これは。。。!!!!
くずし字を機械学習させて、現代人が読める文字に翻訳。
-
“国文学研究資料館が持つくずし字のデータ(日本古典籍くずし字データセット)を学習させて、くずし字を現代語に推論できるシステムだ。” /
古い戸籍を正確に読み取るのにも、活用できそうですね。
もし幕府のお白州の判例や薩長の軍事機密文書、輸出入の記録や翻訳書などが見つかれば、今の慣習も解明できるかも?(文化露寇隠蔽事件とか
「百数十年前までは皆が読めていた「くずし字」。今は人口の0.01%以下しか読めないという現実」
資料館とかに行っても読めないから消化不良に終わることよくあるわ。子供の頃は、書道が達者な母親が読んで教えてくれてたが、当時は知識がなさ過ぎて消化不良だった。今こそ欲しい。
AI使えるな。ついでに現代語に翻訳してくれ。
くずし字にかかる知識はありませんが発想と活用方法がとにかく素晴らしいと思います!
朗報! / Watch)
私は大学で習ったので半分ぐらい読めるけど、
これは欲しい。
古文書がすらすら読めるようになりたい!!
コレはすごい。
意外に間違った読み方が定着した分もあるかも根
文化的に非常に重要
ちゃんと訂正が入ってよかった。「中古書店」の言葉は依然気になるが…。
これ、すごいですね!
畢竟くずし字の読解はディープラーニングだからね。この技術を使いこなせるようになると日本史学界もまた面白いことになるんだろうな。
これは凄い。
浮世絵展があると知ったら行く程度には歴史あるアートが好き(←浮世絵展ないかな〜🔍と能動的に探すほどではないけど)なので、とてもワクワクします☺️
え、凄くない?(;´Д`)
まぁ私には翻訳されてもその文章が理解出来ませんが…
85%だとちょっと厳しいけど、1文字単位の画像認識で85%なら、前後の文字や文脈で予想するアルゴリズムと組み合わせれば、もっと精度上がりそう。 /
すると、手書きの戸籍なんかは楽々かな?

いい使い方/
いいね。次は現代語訳に変換するところも期待(ぇ /
うひょー /
思ってたより早かった。個人で利用できれば楽しみが広がる。/
これはすごい
こういう活動をやれるよう、頑張るかー
これは欲しいかもーすごい。
便利になる反面、崩し字を読む大学の授業が成り立たなくなる。
85%はすでに高め。 /
1万人ぐらいは今もくずし字読めるってことに驚く→
DeepLearning出始めた頃、古文書OCRはよはよと思っていたけど、いよいよきたか
素晴らしい。古文を現代文になおしてくれると、過去を現在の心が繋がる。 /
いやいやいやこれはすげぇ。大興奮。古い書物バンバン読めるようになるじゃん! /
版本をそんな持ち方している写真がとても嫌です。
tkasasagiさん、研究内容的に英語が堪能な日本人だと思っていたら違った。びっくり。
わお、すごい。ドイツ語の髭文字なんかもう簡単にやれちゃうんだろうなー。最近、髭文字も読んでないから、次読むとなると楽な方に走ってしまいそうな誘惑に駆られる /
記事の訂正がところどころに
マジか!!
タイトルは「翻訳」のままだけど、本文には色々訂正入ったか。 /
ななななんですと!(挙動不審):
おおおお!崩し字の翻字機能だと?!
このニュースで狂喜乱舞する「日本史研究者でない人」はもれなく「マニア」ということでいいですか?/
古い石碑などに書かれた文字もその場でスマホかざしてかんたんに読めるようになるかも //
これはいいAI /
本文いっかい消して、リリースそのまま転載したほうが誤解を減らせるんじゃないかな。:
これなら家にある謡本の読めないところが読めるかな。
日本語🇯🇵のくずし字翻訳ツールの登場が話題になっているのですが、ユニコードでは基本的なくずし字が約250種以上も採用されているので、くずし字の研究が進んで、ユニコード未登録のくずし字が仮名文字拡張-Aに追加されてほしいです。
これで全部解決みたいな記事の書き方はどうかと思うけどまあありがたいものですね。 /
くずし字や、草書体に、クセ字が加わると「お手上げ」ですからね。
「読める……読めるぞ……!」 /
崩し字翻刻の世界は、
・口伝(師から弟子に代々伝わる流儀がある)
・似ている字は、崩し字辞典の類例と一個一個照らし合わせる
・時に翻刻すること自体が論文になる
という超アナログな世界。4割くらいの精度でいいので自動化できれば研究時間の使い方はかなり変わってくる
AIで日本史研究者やマニアが狂喜乱舞する「くずし字」の翻訳ツールが開発| 〈撮影したくずし字の古文書などにOCRをかけ、現代語に置き換える。1ページの置き換えにかかる時間はわずか2秒と高速だ。(…)こうした翻訳では重要になってくる正確性はじつに85%とのこと〉
これはありがたい。自分でも何とか解読しようとしてるけど、エライこと時間がかかるからな……
へええええ!面白い!11月のシンポジウム聴講したい~
いくつか訂正を入れました、関係各所にはご迷惑をおかけして申し訳ありません
AIで「くずし字」の翻訳ツール開発...
天才!Σ(*゚Д゚*)
これU-Netでうまくいくのか……わからないものだなあ……
近い内に、歴史の教科書が変わるかも。いろいろ可能性が膨らむなぁ。>
おおおおー!
日本で長らく求められてきたことがG社の技術で完成か。
すばらしい。使いたい
すごいなぁ…。
すごいな。 /
是非無償サービスとして公開してほしい。 >
すごーい
日本のIT会社にやって欲しかったな、、、、
これは凄い!|
Kaggleのネタ、Googleが開発終わった後に流用してるのか

»
“情報・システム研究機構 データサイエンス共同利用基盤施設ROIS-DS人文学オープンデータ共同利用センター 特任研究員 および 国立情報学研究所 タリン・カラーヌワット氏” 肩書き長っ!白鳥さん並やん / AIで日本史研究者やマニアが狂喜乱舞する「くずし字」の翻…”
多少精度が悪くても活字にさえなれば現代語訳は比較的容易なのだろう。 /
「先生、これなんて読むんすか?」
「あーこれか、うん、わかんないな」
…って先生もいましたよえぇ。
えええ!?
源氏物語に惹かれ、早大で日本文学を学び、UCLAと早大の変体仮名に関する共同研究に参画した後、GoogleでAIを使ったくずし字の翻訳ツールを開発した(恐らく)タイ人って時点で、情報満載過ぎ…
正確性はじつに85%とのこと。カラーヌワット氏は、「この85%という数字は16冊の書籍で試した段階のデータ。将来的にはもっとデータが増えて学習が進めば正確性も上がっていくだろう」

AIで日本史研究者やマニアが狂喜乱舞する「くずし字」の翻訳ツール
スゲェ!
くずし字も認識!  認識で一番むずかしいハズなのに。
歴文に朗報でござる。
後、くずし字読める人は全然いないんだな。
くずし字が読み取れるのはすげぇな…!!
Googleってほんとすごいな。
もっと見る (残り約175件)

記事本文: AIで日本史研究者やマニアが狂喜乱舞する「くずし字」の翻訳ツールが開発 - PC Watch

関連記事