太陽光発電遠隔監視 おひさまモニター
[
日本語文字コード
]
URLのエンコード・デコード
エンコード
文字コード
Shift-JIS
EUC-JP
JIS
UTF-8
UTF-16LE
UTF-16BE
変換対象外
英数と_!'()~-*. 以外
英数と_!'()~-*./:?=& 以外
全文字変換(16進ダンプ)
変換方法
1バイト毎
1文字毎
デコード
一般にURLには日本語等の文字は使用できません、フォームで入力した「日本語等」は通常はブラウザが「符号化された文字」へ変換してくれます
自分で変換したい場面は少ない思いますが、まれにあるかと思います
この「日本語等」を「符号化された文字」へ変換する事をエンコードと言います
逆に「符号化された文字」から「日本語等」に戻す事をデコードと言います
URLのエンコードは、Internet Explorer で実験した結果、次に規則で変換しているようです
1バイトの英数文字 (A-Z、a-z、0-9) と記号の一部 (_!'()~-*.) はそのまま
半角スペースは「+」に変換
その他の文字は「%+16進数2桁の文字コード」に変換
JIS はエスケープシーケンスを付けて表示します(先頭の ESC ( B のみ付けません)
UTF-8の場合、BOM(EFBBBF)は付けずにUTF-16LEはBOM(FFFE) UTF-16BEはBOM(FEFF)付けて表示します
デコードの場合
UTF-16ではBOMが必須です、文字化けする場合、BOMを付けて見てください
%u+16進数6桁 の形式はUTF-8に多い、これにも対応しています
%u+16進数4桁 は、下のJavaScriptでデコードした時に発生します、UTF-16BEでBOM(FEFF)なしのようです、しかも、1バイトコードと混在です、すべてがそうであるかどうか知れませんがこれを無理やり変換するために、%u+16進数4桁 でBOM(FEFF)が無い場合ははUTF-16BEでBOM(FEFF)なしとしておきます
JavaScriptでもエンコード・デコードがあります(ブラウザとそのバージョンにより変換方法が統一されていないとの事です)
半角スペースは「+」に変換していなく、しかも「+」はそのままです
JavaScript(escapce、unescapce)でのエンコード・デコード
!"#$%&\'()*+,-./:;<=>?@[]^_`{|}~ はどう変換されるか
ご意見・ご要望等、お気付きの点がございましたら連絡ください
フォームメール無料レンタル