title
2009年
3月
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30 31
AV | Car | Game | Internet | IT | Linux | Movie | other | PC | RC | Reading | SmartPhone | Web


2009-03-15 文字

_ どうにもこうにも、文字コードってヤツは・・・・・

色々と振り回してくれる(汗)

変換しきれないってのがミソだな(苦笑)

プラットフォームでも違う.

OSが違えば、クライアント・サーバ間で、複数環境化からアクセスが、元のデータを共用して他の環境から、などなど.

色々制限が加わるのをなんとか逃げ切りたいのだが(苦笑)

_ 今日は perl で utf-8 を扱う環境下で、文字数を数える!

utf-8 フラグは付けると既存の他の部分に影響がでるので付けたくない. この第一前提があると一発では行かない.

全角は3バイトで構成されている「事が多い」のだが・・・・・

で、考えた. URLエンコードだ!

1バイト分が %** になる. が、中には2バイトで構成されているものや、記号系は1バイトだったりする.

・・・・・う〜む・・・・・と、コード表を眺めていると、ちゃんと体系立っているではないですかっ!

Eで始まる3バイト系、C・Dで始まる2バイト系、それ以外の1バイト系. ほぼコレで問題ないようだ.

早速実装! うむ、見事に今あるサンプルでは文字化けが消えた.

今後、文字化けがでたらマズいけど、多分コレで行けるんじゃないかなぁ?!

原始的な手だけど、だから簡単なのだヨ(苦笑)



Links
  • Smoug Mail
    無料/有料 の、メールアドレス発行サービス。
    スパムフィルタ、アンチウィルス標準搭載!
«前の日記(2009-03-14) 最新 次の日記(2009-03-16)»