この文書は rfc1468 を私 (yotti@imasy.or.jp) が勉強と好奇心のため適当に 訳したものです。 翻訳の正確さは全く保証しません。 誤字誤訳等の指摘はいつでも大歓迎です。 【1998/05/11】 Hitoshi Ozeki さん (h-ozeki@ipc-tokai.or.jp) よりの指摘により 若干修正。 【1999/07/13】 IIDA Yosiaki さん (iida@ring.gr.jp) よりの指摘により 若干修正。 -- Network Working Group J. Murai Request for Comments: 1468 Keio University M. Crispin Panda Programming E. van der Poel June 1993 | Japanese Character Encoding for Internet Messages インターネットメッセージのための日本語表記法 | Status of this Memo このメモの位置付け | This memo provides information for the Internet community. It does | not specify an Internet standard. Distribution of this memo is | unlimited. このメモはインターネットコミュニティのための広報である。これはなんらイン ターネット標準を定めるものではない。このメモの配布に制限は設けない。 | Introduction 始めに | This document describes the encoding used in electronic mail [RFC822] | and network news [RFC1036] messages in several Japanese networks. It | was first specified by and used in JUNET [JUNET]. The encoding is now | also widely used in Japanese IP communities. この文書は、日本のネットワークにおける電子メール[RFC822]とネットニュース [RFC1036]の文字表記方法について述べる。これは最初、 JUNET[JUNET]で定めら れ、使用されていた。この表記法は、今では広く日本のIPコミュニティで使用さ れている。 | The name given to this encoding is "ISO-2022-JP", which is intended | to be used in the "charset" parameter field of MIME headers (see | [MIME1] and [MIME2]). この表記法に "ISO-2022-JP" という名前を与え、MIME ヘッダの "charset" パラ メタで使用されることを意図する ([MIME1]及び[MIME2] を見よ) 。 | Description 記述 | The text starts in ASCII [ASCII], and switches to Japanese characters | through an escape sequence. For example, the escape sequence ESC $ B | (three bytes, hexadecimal values: 1B 24 42) indicates that the bytes | following this escape sequence are Japanese characters, which are | encoded in two bytes each. To switch back to ASCII, the escape | sequence ESC (B is used. テキストは、ASCII[ASCII]で始まり、エスケープシーケンスにより日本語文字に 切り替える。例えば、エスケープシーケンス '$' 'B' (3バイト、16進表記 で 1B 24 42) 以降の文字は日本語文字となり、それらは2バイト毎に表される。 ASCII に切り替えたいときには、エスケープシーケンス ' (' 'B' を使 う。 | The following table gives the escape sequences and the character sets | used in ISO-2022-JP messages. The ISOREG number is the registration | number in ISO's registry [ISOREG]. この表は、ISO-2022-JP メッセージで使うエスケープシーケンス (Esc Seq) と文 字セットを示す。ISOREG 番号は ISO の国際登録簿の登録番号[ISOREG]である。 Esc Seq 文字セット ISOREG ESC ( B ASCII 6 ESC ( J JIS X 0201-1976 (ローマ字セット) 14 ESC $ @ JIS X 0208-1978 42 ESC $ B JIS X 0208-1983 87 | Note that JIS X 0208 was called JIS C 6226 until the name was changed | on March 1st, 1987. Likewise, JIS C 6220 was renamed JIS X 0201. 注: JIS X 0208 は、1987年3月1日に名前が変わるまで JIS C 6226 と呼ばれてい た。同様に、JIS C 6220 は JIX X 0201 に名前を変えた。 | The "Roman" character set of JIS X 0201 [JISX0201] is identical to | ASCII except for backslash () and tilde (~). The backslash is | replaced by the Yen sign, and the tilde is replaced by overline. This | set is Japan's national variant of ISO 646 [ISO646]. JIS X 0201 のローマ字セットは、ASCII のバックスラッシュとチルダを置き換え た以外まったく同一のものである。バックスラッシュは円記号に、チルダはオー バーラインに置き換えられている。このセットは、日本で使われている ISO 646 [ISO646]の変種である。 | The JIS X 0208 [JISX0208] character sets consist of Kanji, Hiragana, | Katakana and some other symbols and characters. Each character takes | up two bytes. JIS X 0208[JISX0208]文字セットは、漢字・平仮名・片仮名及び、いくつかの記 号と文字からなっている。どの文字も2バイト毎で表記する。 | For further details about the JIS Japanese national character set | standards, refer to [JISX0201] and [JISX0208]. For further | information about the escape sequences, see [ISO2022] and [ISOREG]. JIS の標準日本語文字セットについて詳しく知りたいなら、[JISX0201] と [JISX0208]を参照すること。エスケープシーケンスについて詳しく知りたいな ら、[ISO2022]と[ISOREG]を見ること。 | If there are JIS X 0208 characters on a line, there must be a switch | to ASCII or to the "Roman" set of JIS X 0201 before the end of the | line (i.e., before the CRLF). This means that the next line starts in | the character set that was switched to before the end of the previous | line. もし、行中に JIS X 0208 文字があるならば、行末までに ASCII または JIS X 0201 ローマ字に切り替えなくてはならない (すなわち、 の前までに) 。これは、次の行が前の行の終わる前に切り替えられた文字セットで始まること を意味する。 | Also, the text must end in ASCII. また、テキストは ASCII で終わらなければならない。 | Other restrictions are given in the Formal Syntax below. その外の制限事項は、「正式な文法」の節以降で示す。 | Formal Syntax 正式な文法 | The notational conventions used here are identical to those used in | RFC 822 [RFC822]. ここで使用する記法は、RFC 822 [RFC822] で使われているものと同一である。 | The * (asterisk) convention is as follows: * (アスタリスク) の規則は、以下の通り: l*m something | meaning at least l and at most m somethings, with l and m taking | default values of 0 and infinity, respectively. somethings が l 以上 m 以下繰り返すことを意味する、またデフォルト値はそれ ぞれ 0 と 無限大である。 message = headers 1* (CRLF *single-byte-char *segment single-byte-seq *single-byte-char) | ; see also [MIME1] "body-part" | ; note: must end in ASCII ; [MIME1]の"body-part"も見よ ; 注:ASCII で終わらなくてはならない | headers = headers = <[RFC822]の"fields"と[MIME1]の"body-part"を見よ> segment = single-byte-segment / double-byte-segment single-byte-segment = single-byte-seq 1*single-byte-char double-byte-segment = double-byte-seq 1* (one-of-94 one-of-94) single-byte-seq = ESC "(" ( "B" / "J" ) double-byte-seq = ESC "$" ( "@" / "B" ) CRLF = CR LF | ; (Octal, Decimal.) ; (8進数, 10進数) ESC = ; ( 33, 27.) SI = ; ( 17, 15.) SO = ; ( 16, 14.) CR = ; ( 15, 13.) LF = ; ( 12, 10.) one-of-94 = ; (41-176, 33.-126.) 7BIT = ; (0-177, 0.-127.) single-byte-char = | MIME Considerations MIME についての考察 | The name given to the JUNET character encoding is "ISO-2022-JP". This | name is intended to be used in MIME messages as follows: JUNET 文字表記法を "ISO-2022-JP" と名付ける。この名前は MIME メッセージに おいて、以下のように使うことを意図する。 Content-Type: text/plain; charset=iso-2022-jp | The ISO-2022-JP encoding is already in 7-bit form, so it is not | necessary to use a Content-Transfer-Encoding header. It should be | noted that applying the Base64 or Quoted-Printable encoding will | render the message unreadable in current JUNET software. ISO-2022-JP 表記法は既に7単位符号になっているので、 Content-Transfer-Encoding ヘッダは必要ない。現在の JUNET のソフトウェア は、Base64 や Quoted-Printable 形式を読むことができないことを注意すべき だ。 | ISO-2022-JP may also be used in MIME Part 2 headers. The "B" | encoding should be used with ISO-2022-JP text. ISO-2022-JP は MIME パート2のヘッダでも使われるだろう。 ISO-2022-JP に は、"B" encoding を使うべきだろう。 | Background Information 背景 | The JUNET encoding was described in the JUNET User's Guide [JUNET] | (JUNET Riyou No Tebiki Dai Ippan). JUNET 表記法は JUNET ユーザーズガイド (参考文献[JUNET]参照) で述べられて いる (JUNET 利用の手引き第1版) 。 | The encoding is based on the particular usage of ISO 2022 announced | by 4/1 (see [ISO2022] for details). However, the escape sequence | normally used for this announcement is not included in ISO-2022-JP | messages. この表記法は ISO 2022 の使い方 (詳細は[ISO2022]を見よ) の一部を基にしてい る。 | The Kana set of JIS X 0201 is not used in ISO-2022-JP messages. JIS X 0201 カナ文字は ISO-2022-JP メッセージでは使用しない。 | In the past, some systems erroneously used the escape sequence ESC ( | H in JUNET messages. This escape sequence is officially registered | for a Swedish character set [ISOREG], and should not be used in ISO- | 2022-JP messages. 昔、いくつかのシステムは JUNET メッセージの中でエスケープシーケンス ' (' 'H' を誤って使用していた。このエスケープシーケンスは、スウェーデン用 文字セット[ISOREG]として正式に登録されており、ISO-2022-JP メッセージでは 使用すべきでない。 | Some systems do not distinguish between ESC (B and ESC (J or | between ESC $ @ and ESC $ B for display. However, when relaying a | message to another system, the escape sequences must not be altered | in any way. いくつかのシステムは、 '(' 'B' と '(' 'J' を、また '$' '@' と '$' 'B' を区別せずに表示する。しかしながら、もう 1 つのシス テムへメッセージを中継する時には、エスケープシーケンスを変更してはならな い。 | The human user (not implementor) should try to keep lines within 80 | display columns, or, preferably, within 75 (or so) columns, to allow | insertion of ">" at the beginning of each line in excerpts. Each JIS | X 0208 character takes up two columns, and the escape sequences do | not take up any columns. The implementor is reminded that JIS X 0208 | characters take up two bytes and should not be split in the middle to | break lines for displaying, etc. ユーザ (実装者のことではない) は1行を80カラム以内に、できることなら、75カ ラム以内にすべきだ、引用するときに各行の先頭に ">" を挿入できるようにする ために。全ての JIS X 0208 文字は2カラム使用し、エスケープシーケンスはカラ ムを使わない。実装者は、 JIS X 0208 文字が2バイト使うことを思い出せ、また 表示などのために、その間で行を中断してはならないだろう。 | The JIS X 0208 standard was revised in 1990, to add two characters at | the end of the table. Although ISO 2022 specifies special additional | escape sequences to indicate the use of revised character sets, it is | suggested here not to make use of this special escape sequence in | ISO-2022-JP text, even if the two characters added to JIS X 0208 in | 1990 are used. JIS X 0208 規格は 1990 年に改定され、テーブルの最後に2文字追加された。 けれども、ISO 2022 で定めた、改定された文字セットを示す特別付加エスケープ シーケンスを、ISO-2022-JP テキストでは使用しないように提案する、たとえ JIS X 0208-1990 で追加された2文字を使うとしても。 | For further information about Japanese character encodings such as PC | codes, FTP locations of implementations, etc, see "Electronic | Handling of Japanese Text" [JPN.INF]. PC の日本語文字文字コードや実装例のある FTP ロケーションなどについて詳し く知りたい場合は、 "Electronic Handling of Japanese Text" [JPN.INF] を見 よ。 | References 参考文献 [ASCII] American National Standards Institute, "Coded character set -- 7-bit American national standard code for information interchange", ANSI X3.4-1986. [ISO646] International Organization for Standardization (ISO) , "Information technology -- ISO 7-bit coded character set for information interchange", International Standard, Ref. No. ISO/IEC 646:1991. [ISO2022] International Organization for Standardization (ISO) , "Information processing -- ISO 7-bit and 8-bit coded character sets -- Code extension techniques", International Standard, Ref. No. ISO 2022-1986 (E). [ISOREG] International Organization for Standardization (ISO) , "International Register of Coded Character Sets To Be Used With Escape Sequences". [JISX0201] Japanese Standards Association, "Code for Information Interchange", JIS X 0201-1976. [JISX0208] Japanese Standards Association, "Code of the Japanese graphic character set for information interchange", JIS X 0208-1978, -1983 and -1990. [JPN.INF] Ken R. Lunde , "Electronic Handling of Japanese Text", March 1992, msi.umn.edu (128.101.24.1) :pub/lunde/japan[123].inf [JUNET] JUNET Riyou No Tebiki Sakusei Iin Kai (JUNET User's Guide Drafting Committee) , "JUNET Riyou No Tebiki (Dai Ippan) " ("JUNET User's Guide (First Edition) ") , February 1988. [MIME1] Borenstein N., and N. Freed, "MIME (Multipurpose Internet Mail Extensions) : Mechanisms for Specifying and Describing the Format of Internet Message Bodies", RFC 1341, Bellcore, Innosoft, June 1992. [MIME2] Moore, K., "Representation of Non-ASCII Text in Internet Message Headers", RFC 1342, University of Tennessee, June 1992. [RFC822] Crocker, D., "Standard for the Format of ARPA Internet Text Messages", STD 11, RFC 822, UDEL, August 1982. [RFC1036] Horton M., and R. Adams, "Standard for Interchange of USENET Messages", RFC 1036, AT&T Bell Laboratories, Center for Seismic Studies, December 1987. | Acknowledgements 謝辞 | Many people assisted in drafting this document. The authors wish to | thank in particular Akira Kato, Masahiro Sekiguchi and Ken'ichi | Handa. この文書を書くために、多くの人から協力してもらった。著者は、 Akira Kato, Masahiro Sekiguchi そして Ken'ichi Handa に格別の感謝をしたい。 | Security Considerations セキュリティに関する考察 | Security issues are not discussed in this memo. このメモでは、セキュリティについて述べていない。 | Authors' Addresses 著者の連絡先 Jun Murai Keio University 5322 Endo, Fujisawa Kanagawa 252 Japan Fax: +81 466 49 1101 EMail: jun@wide.ad.jp Mark Crispin Panda Programming 6158 Lariat Loop NE Bainbridge Island, WA 98110-2098 USA Phone: +1 206 842 2385 EMail: MRC@PANDA.COM Erik M. van der Poel A-105 Park Avenue 4-4-10 Ohta, Kisarazu Chiba 292 Japan Phone: +81 438 22 5836 Fax: +81 438 22 5837 EMail: erik@poel.juice.or.jp