September 02, 2003

Trackback の文字コードにまつわる議論についてのお話。

[ ウェブログに関すること ]
UTF-8を扱えるツール(A)は、

* 送信はUTF-8 とし、charset=utf-8 をつけて送信
* 受信時は charset をみて判断。なければ UTF-8 と判断(または自動判別も可)

UTF-8を扱えないツール(B)は、

* 送信はcharset=euc-jp などをつけて送信
* 受信はcharsetをみて、変換できなければ捨てる、ゲタなどの処理

そもそも国際化を考えていないツール(C)は、

* 送信はcharsetをつけず、Blogエンコーディングのまま送信
* 受信はそのまま格納して表示

Trackback の文字コードを UTF-8 にしようてな話で少し議論になっていますが、僕もこの miyagawa さんが示す案がいいのかなあと思ってます。決めうちというよりは、デフォルトぐらいのもうすこし緩いノリですか。

backward compatibility を考えると、いきなり受信側が UTF-8 決めうちで処理しはじめることは不可能なわけで、charset を付けずに UTF-8 以外で送信されてきた内容の文字化けを嫌うならどちらにしろ文字コード判別処理はしばらく入れておく必要があります。

ただ、日本語だけならまだしも、日本語以外の文字コードなんかを考えると全て自動判別で云々ってのはちょっとスペックが高すぎるかなと思いますし、本来それを軽減するのも UTF-8 の目的なはずですから、将来的なことを考えると UTF-8 をデフォルトにしてしまうってのが結構妥当なのかなと思います。UTF-8 を扱えない環境については charset を付けることで対応、と。

とか言いながら座談会のときはあまり深く考えないで、そうっすね!と相槌を打ってしまったわけですが。もうちょっと考えるべきでした。:P

あんまり関係ないですけど、

今まではMTなサイトってミラノさんのところを含め3,4つくらいしか見てなかったんだけど,例の座談会に出席された方々はきっと日本のMT界の大御所なんだろうということでアンテナに追加.

多分他の方は誰が見ても大御所かと思われますが、僕は MT 暦半年程度の正直ヘタレもいいところなので、そこのところヒトツよろしくです。

ちなみに例の blog 座談会が( miyagawa さん、とおるさんは今は blosxom 万歳だけど) MT 経験者な人ばっかじゃねーかというツッコミは、参加してた僕自身からしてそう思ってたので (もう取り消されちゃってますが) きたさんがそう思われたのも当然じゃないかなと。でも、これまた miyagawa さんも書いてるように座談会の中では MT MT 言ってたわけではないです。編集で MT 万歳! になっちゃったら平謝りですが。;)

Posted by naoya at September 2, 2003 12:02 PM | トラックバック (1)  b_entry.gif
トラックバック [1件]
TrackBack URL: http://mt.bloghackers.net/mt/suck-tbspams.cgi/396
トラックバックが文字化けをおこしてしまうじゃないかの巻
Excerpt:  どうやらブログを設置してしまう時点で、文字コードをEUC−JPに置き換えてして...
Weblog: ユキノヒノシマウマ
Tracked: December 17, 2004 04:46 AM
コメント [0件]