海外の技術者が日本語の「文字化け」を本気で解説、日本人顔負けの日本通っぷりが披露される - GIGAZINE

60コメント 2021-11-02 20:06|GIGAZINE

ツイッターのコメント(60)

文字化けという日本語につきまとう盲腸炎のような事象メモ。
Unicodeが普及して以降、ほぼ見る事も無くなってきましたが、今でも半角カタカナを見ると殺意が(笑)
mojibakeっていうのか
戻り値にこれ見よがしにu付けてくるのに、uつけて渡すと対応出来ないmaya2019さん可愛い🥰
真面目に解説してる。おもろいなぁ。

GIGAZINE: 海外の技術者が日本語の「文字化け」を本気で解説、日本人顔負けの日本通っぷりが披露される.
>特に目立つのは『高』の異体字の『髙』で、線がつながっていることから『はしごだか』と呼ばれ
ナルホド。🐈
日本人も知らないような平安時代通の外国人とか
外国人杜氏とか
と同じ匂いがするw
国内の技術者じゃん(大笑い)
「東京で自然言語処理(NLP)の開発をしているポール・オリーリ・マッキャン氏が解説」
譁?ュ怜喧縺代▲縺ヲ讌ス縺励>繧医?縲
縺ェ繧薙°遏・繧峨s縺代←螂ス縺阪↑繧薙h縺ュ縲
「慣れると使われている文字コードの種類を推測することができるそう」

足利義満が座っている畳の縁ww
文字化けの記事
テックネタかと思ったら(いやそうなんだけど)、文字化けから足利義満に飛ぶとは意表w
UNIX/Win/Web/汎用機と混在し、IT現場では日常的に発生する文字化け。EBCDICに言及は無いが良く知ってるな外人。
凄いな〜
本当に何気なく文字化けしているんだ程度にしか考えたことなかったな
会社のPCのエクセルのバージョンが未だにShift-JIS標準でCSV開こうとする。これがまだShift-JISのシステムが残る背景になりグローバルと連携した時文字化けして一時的対策で国内ユーザにUTF-8対応エディタ使えとはいうのも優しくないし悩み中。
なるほどわからんしてきた
ユニコードが普及して文字化けは少なくなったよね。/
ちゃんとmojibakeという単語で理解されてるのか。
PerlのスクリプトってEUC-JPが多かったっけ。でもサイトはShift_JISだったりしていろいろ面倒だった。今は昔… »
文字化けから足利義満が出てくるとは…
おもろいやん
>文字が適切に表示されずに読めなくなってしまう「文字化け」は、海外の技術者の間でも「Mojibake」で通用するとのこと

へー
足利義満の畳の縁が「繧繝縁」からのアニメ「裏世界ピクニック」の看板とは振れ幅がスゴすぎる
「文字が適切に表示されずに読めなくなってしまう『文字化け』は、海外の技術者の間でも『Mojibake』で通用する」
記事の内容はおもしろいけど、EUC-JPについての説明がものっっすごい雑だなー
海外ニキが「はしごだか」と「たつさき」を理解してるのすごい。
私は文字化けに悩まされたし文字コードの本も読んだけど結局よく分らんまま今に至っている。

GIGAZINE「海外の技術者が日本語の「文字化け」を本気で解説、日本人顔負けの日本通っぷりが披露される」
慣れると重力語も読めるようになります()。
文字化けがワードパズルみたいに遊ばれてる!?日本人には出来ない発想だなー(当たり前)
MojibakeとかTofuとか、日本人の苦労は世界に知られているっぽいよ(苦笑。
文字化けマイスターがおるw
この文字コードの違いのせいで何百何千という人の血が流れた事か…あと外字…😭
UTF-8頑張って!
—/
上手くまとまってて細切れの知識が脳内で統合された。
個人的に超良記事。
文字化けって海外でも"Mojibake"で通じるのか...
文字化けは日本文化だった?
文字化けって英語でも「mojibake」なのか……
から文化を語る人が現れました、當方も知らない漢字の知識が出て驚きですね;文字化けという言葉が英語のまま使えるのは知りませんでした
今更感もあるけど、すごいな
普段文字コードを扱ってるので、個人的にツボった。
突破見ちゃうの結構簡単🤭

文字化けは、海外の技術者の間でも「Mojibake」で通用するとのこと。作成した時と異なる文字コードで文書を開くことで発生
EUC-JPは今でも細々と使われているのだよな。そしてEBCDIKも生き残っている。Shift_JISも厳密には拡張漢字による違いがあるし。
「EUC-JPをシフトJISで開いた文字化けで興味深いのは、半角カタカナがよく出てくる点です。これは、シフトJISが半角カタカナを1バイトで表しているからです」
文字コードとかいうムカつくものがあるからな。
面白いね、技術の進歩や違いで互換性がなくなったがゆえにこういうことが起きるんやなって
文字化けにも違いがあるんですって奥様
面白すぎるな、この記事
海外でも「Mojibake」なのね。
»
まるで、デイリーポータルZがお役立ちサイトみたいに出てきて笑う。
文字コード絡みは仕事でよく出くわすが、これはホントにマニアの仕事。
こちとらこの問題を現役でやってきたウェブプログラマーおじさんやぞどいたどいた
shift-jis -> utf-8
をしたいときは
cp932 -> utf-8
とすると幸せになれる
記事中『「文字化け」は、海外の技術者の間でも「Mojibake」で通用するとのこと』
こんな日本語も国際的になってるのか
めちゃくちゃおもろい……
NLPってNatural Language Processingの方じゃないかな。
7bit文字化けもやってw
20世紀末みたいな昔の文字化けも同じ理由なのかしら?
直接関係はないんだけど、シフトJIS関連で、2バイト目の「5C」チェックでよく使われたのが、「ソ連構造改革」だったかな
文字化け、海外でもMOJIBAKEで通じるんだ・・・。それに驚きだわ
海外の技術者が日本語の「文字化け」を本気で解説、日本人顔負けの日本通っぷりが披露される...
以上
 
PR
PR