が原著です。 翻訳版は、翻訳からくる間違いがあり得ます。 Yasutaka Kato 加藤泰孝 ---------------------------------------------------------------------- rfc2234 [rfcディレクトリーのトップへ] Network Working Group K. Tamaru Request for Comments: 2237 Microsoft Corporation Category: Informational November 1997 インターネットメッセージの日本語文字符号化 Japanese Character Encoding for Internet Messages この覚書の位置付け この覚書はインターネット交流の情報を提供します。如何なる種類のインター ネット標準ではありません。この覚書の配布には制限はありません。 著作権覚書(Copyright Notice) Copyright (C) The Internet Society (1997). All Rights Reserved. 1. 要約 この覚書は日本語文字の符号化体系を定義し、電子メール[RFC-822]とネット ワークニュース[RFC 1036]で使用される"ISO-2022-JP-1"を説明します。また、 この覚書はこの符号化体系で使用できる日本語文字セットのリストを提供して います。 2. 必要な記法(Requirements Notation) この文書では、特別な仕様での要求を指すのに、大文字で表わす用語がでてき ます。これらの用語とは、"MUST"・"SHOULD"・"MUST NOT"・"SHOULD NOT"そし て"MAY"です。各用語の意味は、[RFC-2119]にあります。 3. はじめに RFC 1468は日本語文字が符号化されるその方法を、この覚書定義しているもの と同じように、定義しています。ISO-2022-JPテキストの二バイト文字セットと してJIS X 0208の使用を定義しています。 今日、操作システムの多くはふさわしい拡張日本語文字ないしはJIS X 0212を サポートしています。これにはUnicode文字セットもふくまれ、JIS X 0201にも JIS X 0208にも適合しません。従って、これは精密な情報の交換と文通する能 力を制限し、というのは漢字文字に制限があるからです。幸い、JIS (Japanese Industry Standard) は"情報交換用に補足的な図形文字"としてJIS X 0212を定義しています。 多くの場合通常の電子メールで使われている日本語文字セットは、JIS X 0201・JIS・X 0208そしてJIS X 0212を伴うことが可能です。 また、Unicodeを使用する方向があるとしても、Unicodeは未だ広く使用されて いませんし旧い電子メールシステムで制限があります。更に、この文書の目的 はJIS X 0212を書き出す能力を追加することです。 この文書は、JIS X 0212サポートそ追加以外は、iso-2022-jp-1版の情報の如何 なる表現についても言及していません。 4. 説明(Description) "ISO-2022-JP-1"テキストでは、メッセージの初期の文字コードはASCIIです。 二バイト連続体"double-byte-seq"(書式構文セクション参照)(ESC "$""B" / ESC "$" "@" / ESC "$" "(" "D") は、それに続く文字は二バイト(double- byte)ことを指す呼び出しだけで、それは別のエスケープ連続体が来るまで正し いものです。二バイト文字符号化に (ESC "$" "@") を使うことを奨励しなく て、代わりに新しい装備は二バイト符号化用に (ESC "$" "B") だけを使用すべ きです(SHOULD)。 "ISO-2022-JP-1"テキストの終はASCIIでなければなりません(MUST)。また、 行の途中にASCII文字がない場合、JIS X 0201-Romanより各行の終わりてASCII に戻すことが強く推奨されます。 "ISO-2022-JP-1"はJIS X 0212を書き出す能力を追加するよう設計され、その メッセージがJIS X 0212を内容としていないなら"ISO-2022-JP"テキストが使用 されなければなりません(MUST)。 IS X 0201-Romanは、異なった文字が二つあるASCIIです。 以下のリストは、"ISO-2022-JP-1"テキストで使用可能なエスケープ連続体と文 字セットです。ISO 2375登録での登録番号は、ISO/IEC 2022コード構造内で二 バイトヒ表意文字スクリプトが符号化されることができ、reg#の下に指定され ています。 reg# character set ESC sequence designated to 6 ASCII ESC 2/8 4/2 ESC ( B G0 42 JIS X 0208-1978 ESC 2/4 4/0 ESC $ @ G0 87 JIS X 0208-1983 ESC 2/4 4/2 ESC $ B G0 14 JIS X 0201-Roman ESC 2/8 4/10 ESC ( J G0 159 JIS X 0212-1990 ESC 2/4 2/8 4/4 ESC $ ( D G0 その他の制限は以下の書式構文で与えられます。 5. 書式構文(Formal Syntax) ここで使用されている表記規定は、STD 11, RFC 822で使用されているものです [RFC822]。 The * (asterisk) convention is as follows: l*m something meaning at least l and at most m something, with l and m taking default values of 0 and infinity, respectively. iso-2022-jp-1-text = *( line CRLF ) [line] line = (*single-byte-char *segment single-byte-seq *single-byte-char) / *single-byte-char segment = single-byte-segment / double-byte-segment single-byte-segment = single-byte-seq *single-byte-char double-byte-segment = double-byte-seq *(one-of-94 one-of-94) reset-seq = ESC "(" ( "B" / "J" ) single-byte-seq = ESC "(" ( "B" / "J" ) double-byte-seq = (ESC "$" ( "@" / "B" )) / (ESC "$" "(" "D" ) CRLF = CR LF;( Octal, Decimal.) ESC = ;( 33,27.) SI = ;( 17,15.) SO = ;( 16,14.) CR = ;( 15,13.) LF = ;( 12,10.) one-of-94 = ;(41-176,33.-126.) one-of-96 = ;(40-177,32.-127.) 7BIT = ;(0-177,0.-127.) single-byte-char = 6. 安全への配慮(Security Considerations) この覚書はなんら既知の安全性問題を生じていません。 7. MIMEへの配慮(MIME Considerations) 内容の日本語符号化体系に使用される名前は、"ISO-2022-JP-1"です。この名前 がMIMEメッセージ書式内で使用される場合、それは以下のようになります: Content-Type: text/plain; charset=iso-2022-jp-1 "ISO-2022-JP-1"は7ビト符号化ですから、"Content-Transfer-Encoding"ヘッ ダーを特定することによって別の書式に符号化する必要はありません。また、 Based64ないしは Quoted-Printable符号化を提供することは、今日のソフト ウェアーがそのメッセージを復元するのに失敗する原因になるかもしれません (MAY)。 "ISO-2022-JP-1"は、MIMEヘッダーで使用可能です。また、"ISO-2022-JP-1"テ キストはBase64ないしはQuoted-Printable符号化で使用することも可能です。 8. 補足情報(Additional Information) メールシステムがUnicodeを書き出すことができるまでの間、"ISO-2022-JP-1" テキストに加えてUnicodeテキストをも書き出せることが薦められています。ま た、"ISO-2022-JP-1" に加えて"ISO-2022-JP"テキストも書き出すことが、後方 互換性の理由から強く推奨されます。 [RFC 822]と[RFC 1521]で定義されている助変数'parameter'や値'value'に、 8 ビット文字を書き出すメールシステムもあります。全ての8ビット文字は、これ らの領域で使用されるべきではありません(MUST NOT)。将来のメールシステム は、相互操作性上の理由のためにのみこれらをサポートすべきです (SHOULD)。 9. 参考資料 [ISO2022] International Organization for Standardization (ISO), "Information processing -- ISO 7-bit and 8-bit coded character sets -- Code extension techniques", International Standard, Ref. No. ISO 2022-1986 (E). [ISOREG] International Organization for Standardization (ISO), "International Register of Coded Character Sets To Be Used With Escape Sequences". [RFC-822] Crocker, D., "Standard for the Format of ARPA Internet Text Messages", STD 11, RFC 822, August 1982. [RFC-1468] Murai, J., Crispin, M., and E. van der Poel, "Japanese Character Encoding for Internet Messages", RFC 1468, June 1993. [RFC-1766] Alvestrand, H., "Tags for the Identification of Languages", RFC 1766, March 1995. [RFC-2045] Freed, N., and N. Borenstein, "Multipurpose Internet Mail Extensions (MIME) Part One: Format of Internet Message Bodies", RFC 2045, December 1996. [RFC-2046] Freed, N., and N. Borenstein, "Multipurpose Internet Mail Extensions (MIME) Part Two: Media Types", RFC 2046, December 1996. [RFC-2047] Moore, K., "Multipurpose Internet Mail Extensions (MIME) Part Three: Representation of Non-ASCII Text in Internet Message Headers", RFC 2047, December 1996. [RFC-2048] Freed, N., Klensin, J. and J. Postel, "Multipurpose Internet Mail Extensions (MIME) Part Four: MIME Registration Procedures", RFC 2048, December 1996. [RFC-2049] Freed, N., and N. Borenstein, "Multipurpose Internet Mail Extensions (MIME) Part Five: Conformance Criteria and Examples", RFC 2049, December 1996. [RFC-2119] Bradner, S., "Key words for use in RFCs to Indicate Requirement Levels", RFC 2119, March 1997. Author's Address Kenzaburo Tamaru Microsoft Corporation One Microsoft Way Redmond, WA 98052-6399 EMail: kenzat@microsoft.com 著作権声明全文(Full Copyright Statement) Copyright (C) The Internet Society (1997). All Rights Reserved. この文書とその翻訳を複写や他人に供与してもかまいませんし、コメン トを付けたり若くは別途にそれを解説したりまた装備を補佐するといっ た派生的な作品を作製し、複写・発行・配布、全文であれ抜粋であれ如 何なる種類の制限なしに、してもかまいませんが、上記の著作件覚書と この段落を全ての複写と派生作品に含むようにしておきます。しかし、 この文書自体は如何なる方法、著作件覚書やInternet Societyやその他 のInternet organizationsへの参照をを外したりといった、でも修正さ れないかもしれませんが、インターネット標準の発展の目的に必要な場 合を除くが、その場合インターネット標準過程で定義されている著作件 の手順、また必要に応じて英語以外の言語にそれを翻訳するために、に 従わなければなりません。 This document and translations of it may be copied and furnished to others, and derivative works that comment on or otherwise explain it or assist in its implementation may be prepared, copied, published and distributed, in whole or in part, without restriction of any kind, provided that the above copyright notice and this paragraph are included on all such copies and derivative works. However, this document itself may not be modified in any way, such as by removing the copyright notice or references to the Internet Society or other Internet organizations, except as needed for the purpose of developing Internet standards in which case the procedures for copyrights defined in the Internet Standards process must be followed, or as required to translate it into languages other than English. 上記で与えられたこの制限付許可は恒久的なもので、Internet Society 若くはその継承者もしくは譲渡人によって破棄されるものではありませ ん。 The limited permissions granted above are perpetual and will not be revoked by the Internet Society or its successors or assigns. この文節を内容としているこの文書と情報は、「現状のまま」の原理で提供さ れ、THE INTERNET SOCIETYとTHE INTERNET ENGINEERING TASK FORCEは、この文 節の情報の使用は商業向き若くはある特殊な目的への適合の如何なる正当性や 暗黙の保証責任に反する保証責任、これだけに限りませんが、を含み、全ての 明示的暗黙的な保証責任を負いません。 This document and the information contained herein is provided on an "AS IS" basis and THE INTERNET SOCIETY AND THE INTERNET ENGINEERING TASK FORCE DISCLAIMS ALL WARRANTIES, EXPRESS OR IMPLIED, INCLUDING BUT NOT LIMITED TO ANY WARRANTY THAT THE USE OF THE INFORMATION HEREIN WILL NOT INFRINGE ANY RIGHTS OR ANY IMPLIED WARRANTIES OF MERCHANTABILITY OR FITNESS FOR A PARTICULAR PURPOSE.