UTF-8からSJISに文字化けすると糸偏の漢字がよく出てくる - Qiita

57コメント 2018-02-15 01:05|Qiita

ツイッターのコメント(57)

Qiitaで1番好きな記事です
もうひとつは、ファイル名が文字化けする。糸へんの漢字が出るタイプで、どんなファイルに起きているのかの傾向は読み取れず。
文字化け自体はUTF-8をSJISとして読もうとすると起きるタイプとのこと。
今日のトリビア
これなるほどにゃんね
文字化けってなんで糸偏ばっかなんだろうって思って調べたらちゃんと出てくるのね!
ひらがなカタカナのほとんどは「縺」「繧」「繝」に変換されちゃうんだって!すごい!
@mizzkit_killa
文字コード変換でちょうど糸へんの感じがある所にひらがながくる……ということらしいです
長年の疑問が解決した
文字化けするといとへんの漢字がよく出てくる理由についてはこのあたりに書かれている
文字化けの詳しい解説もちゃんと読んだ。
にゃるほど
@jiang1qi21 こんな記事がありました。なるほどわからん。
わかりやすい
ちょっとググったら解説記事があった
@capripon それさっき見た

大体ひらがなのせい
そしてこんな説明も。素敵だわw
UTF-8→JISの変換による文字化けで「繧繝」がやたらと出てくるのは
ぁ~み → 繝
む~タ → 繧
と変換されるため
ちなみに「繧繝」はうんげんと読む彩色法の一種
文字化けってなんで糸偏多いのだ?と思って調べたら3秒でヒットしたのだ…
なるほど
「UTF-8からSJISに文字化けすると糸偏の漢字がよく出てくる」参照
@BANandLAW なんかUTF-8で保存された文字をSJISに無理やりすると、なるらしいー
(調べた
[UTF-8からSJISに文字化けすると糸偏の漢字がよく出てくる]


文字化けの際、 "縺・繧・繝" を、たまに見掛ける理由が何となく分かった。

それはそうと、この辺の文字化けを見掛けると、ホラー的なフラグとして、一瞬 身構えてしまう件w
文字化けで糸偏の漢字が多い理由。
さすがQiita頼りになるってハッキリわかんだね
\長年の疑問が解けた…!/

あと\横浜優勝/の斜線の出し方を思い出した!w ちなMac
なるほど(無知の知)
某ゲームのテキスト解読はこれが取っ掛かりなのだろうか。
@emerald_sedan ちゃんと解説してるサイトがありました
おもしろい
ふんわりわかった(わかってない)
文字化けネタじわじわ来る
言われてみればその通りだった。「UTF-8のひらがなやカタカナをSJISで解釈すると「縺」「繧」「繝」の三文字が出て来ることがわかりました」 /
@Qiita
職場で文字化け見つけて何日か前にこの記事読んでたからめっちゃテンション上がった
おもろい、Good job!

@Qiita
おもしれえw
文字化けでよくみる「繧繝」がちゃんとした言葉としてあったとは>
糸偏化けはウニ→シフトJとな
@Qiita

これは分かりやすい!!
よくよく考えてみればその通りなんだけど、そもそもこんなこと突っ込んで考えないしなw
勉強になった。
考えたこともなかった。
これから文字化けを見るのが楽しくなりそう。

@Qiita
面白い記事だ /
@Qiita
なるほどこうなってたのか
確かに糸偏多いなぁと思ってたけど調べようとまでは思わなかった。大変興味深いお話でした。 /
縺翫b縺励m縺・
トリビア的な記事だけど、説明が分かりやすすぎる!!!
UTF-8のひらがなカタカナからSJISの「縺」「繧」「繝」に…えっこの3文字?もっといっぱい出てくる気がしてたのに / あとISO-2022-jp中の「&」が「"」になって「う瘢雹」に化けたり / “UTF-8からS…”
コメントまで含めて楽しい読み物。文字化けソムリエの某氏にもこういうのを書いていただきたい。
言われてみればその通りだ…なんとなく気になっていたことをしっかり調べるのって大事… |
「UTF-8のひらがなやカタカナをSJISで解釈すると「縺」「繧」「繝」の三文字が出て来る」
ほー。

/
以上
 
PR
PR