RFC1522 日本語訳
1522 MIME (Multipurpose Internet Mail Extensions) Part Two: MessageHeader Extensions for Non-ASCII Text. K. Moore. September 1993. (Format: TXT=22502 bytes) (Obsoletes RFC1342) (Obsoleted by RFC2045, RFC2046, RFC2047, RFC2048, RFC2049) (Status: DRAFT STANDARD)
RFC一覧
英語原文
Network Working Group                                           K. Moore
Request for Comments: 1522                       University of Tennessee
Obsoletes: 1342                                           September 1993
Category: Standards Track
|          MIME (Multipurpose Internet Mail Extensions) Part Two:
|               Message Header Extensions for Non-ASCII Text
         MIME (Multipurpose Internet Mail Extensions)パートII:
              非ASCIIテキスト対応メッセージヘッダの拡張
| Status of this Memo
メモのステータス
|    This RFC specifies an Internet standards track protocol for the
|    Internet community, and requests discussion and suggestions for
|    improvements.  Please refer to the current edition of the "Internet
|    Official Protocol Standards" for the standardization state and status
|    of this protocol.  Distribution of this memo is unlimited.
   この RFC では、インターネット社会におけるインターネット・スタンダード・
   トラックとなったプロトコルの仕様を定義します。また、よりよい発展のた
   めに、このプロトコルについての議論、提案を広く求めます。このプロトコ
   ルの現在の規格化のステート、およびステータスの詳細については、最新版
   の『Internet Official Protocol Standards』を参照してください。このメ
   モの再配布は、自由におこなってください。
| Abstract
概要
|    This memo describes an extension to the message format defined in RFC
|    1521 [1], to allow the representation of character sets other than
|    ASCII in RFC 822 (STD 11) message headers.  The extensions described
|    were designed to be highly compatible with existing Internet mail
|    handling software, and to be easily implemented in mail readers that
|    support RFC 1521.
   このメモでは、 RFC822 (STD 11) でメッセージヘッダとして定められた非
   ASCII の文字セットを使った表現を許す、 RFC1521 [1] で定義されたメッセー
   ジフォーマットへの拡張について説明します。ここで説明するヘッダへの拡
   張は、現在インターネットで広く使われているメールの処理をするソフトウェ
   アとの共存ができるように考慮されています。またこの拡張により、 RFC1521
   形式のメールリーダの実装を容易にすることを狙っています。
| 1. Introduction
1. はじめに
|    RFC 1521 describes a mechanism for denoting textual body parts which
|    are coded in various character sets, as well as methods for encoding
|    such body parts as sequences of printable ASCII characters.  This
|    memo describes similar techniques to allow the encoding of non-ASCII
|    text in various portions of a RFC 822 [2] message header, in a manner
|    which is unlikely to confuse existing message handling software.
   RFC1521 では、様々な文字セットで記述されているテキストのボディパート
   を、表示可能な ASCII コード文字へとエンコードすることでその表現を可能
   にする仕組みについて説明しました。このメモでは、非 ASCII コードのテキ
   ストを既存のメッセージハンドラを混乱させないようにエンコードして、
   RFC822 [2] 準拠のメッセージヘッダの一部として使えるようにする方法につ
   いて説明します。
|    Like the encoding techniques described in RFC 1521, the techniques
|    outlined here were designed to allow the use of non-ASCII characters
|    in message headers in a way which is unlikely to be disturbed by the
|    quirks of existing Internet mail handling programs.  In particular,
|    some mail relaying programs are known to (a) delete some message
|    header fields while retaining others, (b) rearrange the order of
|    addresses in To or Cc fields, (c) rearrange the (vertical) order of
|    header fields, and/or (d) "wrap" message headers at different places
|    than those in the original message.  In addition, some mail reading
|    programs are known to have difficulty correctly parsing message
|    headers which, while legal according to RFC 822, make use of
|    backslash-quoting to "hide" special characters such as "<", ",", or
|    ":", or which exploit other infrequently-used features of that
|    specification.
   RFC1521 で説明されているエンコードの場合と同様に、この手法では既存の
   インターネットで使われているメールハンドルプログラムを混乱させること
   なく非 ASCII コードの文字を使えるように考慮されています。特に、いくつ
   かのメール転送プログラムでは、次のような現象が起きることがあります。
   (a) ヘッダ中にある特定のフィールドがあると関連する別のフィールドを破棄
       する。
   (b) To: フィールドや Cc: フィールドのアドレスの順番を入れ換える。 
   (c) フィールドの出現順序を入れ換える。 
   (d) メッセージのヘッダが折り曲げられて、本来の位置とは違う場所に表示さ
       れる。
   さらに、いくつかのメールリーダでは、「<」、「,」、「:」などの文字に対
   しての RFC822 に従ったバックスラッシュを使ったクォーティングを、理解
   できずにパースができなかったり、使用頻度が低い機能を指定した場合にも
   パースできなかったりします。
|    While it is unfortunate that these programs do not correctly
|    interpret RFC 822 headers, to "break" these programs would cause
|    severe operational problems for the Internet mail system.  The
|    extensions described in this memo therefore do not rely on little-
|    used features of RFC 822.
   不幸なことに、 RFC822 のヘッダを正しく解釈できないこのようなプログラ
   ムを破棄するということは、インターネットでのメールシステムの運用に深
   刻な問題を引き起こすことになります。
   このメモで説明する拡張では、このような使用頻度が低い RFC822 の特殊な
   機能にも依存していません。
|    Instead, certain sequences of "ordinary" printable ASCII characters
|    (known as "encoded-words") are reserved for use as encoded data.  The
|    syntax of encoded-words is such that they are unlikely to
|    "accidentally" appear as normal text in message headers.
|    Furthermore, the characters used in encoded-words are restricted to
|    those which do not have special meanings in the context in which the
|    encoded-word appears.
   そのかわり、特定の「ごく普通に」表示可能な (「encoded-word」と呼ばれ
   る) ASCII コードの文字の集合がエンコードされたデータの表現用に予約さ
   れています。 encoded-word の文法は、通常のメッセージヘッダのテキスト
   中に「偶然には」出現しにくいものにしてあります。
   しかも、encoded-wordに使われる文字は、 encoded-word が出現する場所で
   特別な意味を持たないように制限されます。
|    Generally, an "encoded-word" is a sequence of printable ASCII
|    characters that begins with "=?", ends with "?=", and has two "?"s in
|    between.  It specifies a character set and an encoding method, and
|    also includes the original text encoded as graphic ASCII characters,
|    according to the rules for that encoding method.
   一般に「encoded-word」は、表示可能な ASCII コードの文字からなる文字列
   で、「=?」で始まり、「?=」で終ります。また、その間に2つの「?」があり
   ます。この文字列には、もとのテキストで使われている文字セットとエンコー
   ド方式、そしてテキストを表示可能な ASCII テキストにエンコードしたもの
   を記述します。
|    A mail composer that implements this specification will provide a
|    means of inputting non-ASCII text in header fields, but will
|    translate these fields (or appropriate portions of these fields) into
|    encoded-words before inserting them into the message header.
   メールの編集プログラムは、非 ASCII の文字セットを使ったヘッダフィール
   ドの入力を、 encoded-word に変換してメッセージヘッダ(フィールドの適切
   な部分) に挿入します。
|    A mail reader that implements this specification will recognize
|    encoded-words when they appear in certain portions of the message
|    header.  Instead of displaying the encoded-word "as is", it will
|    reverse the encoding and display the original text in the designated
|    character set.
   メールのリードプログラムは、このエンコードされたテキストが、メールヘッ
   ダの適切な部分に出現した場合にその記述を認識して、 encoded-word 「そ
   のもの」ではなくて、もとに戻したテキストを表示します。
|    NOTES
   注意
|       This memo relies heavily on notation and terms defined STD 11, RFC
|       822 and RFC 1521.  In particular, the syntax for the ABNF used in
|       this memo is defined in STD 11, RFC 822, as well as many of the
|       terms used in the grammar for the header extensions defined here.
|       Successful implementation of this protocol extension requires
|       careful attention to the details of both STD 11, RFC 822 and RFC
|       1521.
      このメモは、 STD 11、RFC 822、RFC 1521 に表記法や用語において強く
      依存しています。特に、このメモで使われる ABNF の構文は、STD 11、
      RFC 822 で定義されています。ヘッダの拡張に対しての文法で使われてい
      る用語についても同様です。このプロトコル拡張の正しい実装をするにあ
      たっては、STD 11、RFC 822、 RFC 1521 の詳細について理解しているこ
      とが要求されます。
|       When the term "ASCII" appears in this memo, it refers to the "7-
|       Bit American Standard Code for Information Interchange", ANSI
|       X3.4-1986.  The MIME charset name for this character set is "US-
|       ASCII".  When not specifically referring to the MIME charset name,
|       this document uses the term "ASCII", both for brevity and for
|       consistency with STD 11, RFC 822.  However, implementors are
|       warned that the character set name must be spelled "US-ASCII" in
|       MIME message and body part headers.
      また、このメモで「ASCII」と表記されるものは、『7-bit Ameriacan
      Standard Code for Information Interchange』, ANSI X3.4-1986 を暗黙
      的に指すものとします。 MIME の charset 名でこの文字セットに対応す
      るのは、「US-ASCII」です。この文書では MIME の charset 名を指す場
      合を除いて、簡潔さと STD 11、RFC 822 との一貫性のためにこの文字セッ
      トを表す用語として「ASCII」を使います。実装者は、 MIME のメッセー
      ジやボディ・パートのヘッダで指定する文字セット名には、必ず
      US-ASCII」と表記することに注意してください。
| 2. Syntax of encoded-words
2. encode-wordの構文
|    An "encoded-word" is defined by the following ABNF grammar.  The
|    notation of RFC 822 is used, with the exception that white space
|    characters MAY NOT appear between components of an encoded-word.
   「encoded-word」は、 RFC822 が表記法として使っている ABNF 文法で、次
   のように定義されています。この表記法は RFC 822 とほぼ同じですが、
   encoded-word のコンポーネントの間に空白文字が出現しない点で異なります。
|    encoded-word = "=?" charset "?" encoding "?" encoded-text "?="
   encoded-word = "=" "?" charset "?" encoding "?" encoded-text "?" "="
|    charset = token    ; see section 3
   charset = token    ;  第3章を参照のこと。
|    encoding = token   ; see section 4
   encoding = token   ; 第4章を参照のこと。
|    token = 1*
   token = 1* <空白文字、制御文字、 especials を除いた任意の文字>
|    especials = "(" / ")" / "<" / ">" / "@" / "," / ";" / ":" / "
|                <"> / "/" / "[" / "]" / "?" / "." / "="
   especials = "(" / ")" / "<" / ">" / "@" / "," / ";" / ":" / "\" /
	      <"> / "/" / "[" / "]" / "?" / "." / "="
|    encoded-text = 1*
|                      ; (but see "Use of encoded-words in message
|                      ; headers", section 5)
   encoded-text = 1*<表示可能な ASCII 文字で"?"、空白文字以外のいずれか>
                     ; (第 5 章『メッセージヘッダでの encoded-word の使
                     ; い方』を参照のこと) 
|    Both "encoding" and "charset" names are case-independent.  Thus the
|    charset name "ISO-8859-1" is equivalent to "iso-8859-1", and the
|    encoding named "Q" may be spelled either "Q" or "q".
   「encoding」、「charset」に使う名前は、大小文字を問いません。つまり、
   文字セット名「ISO-8859-1」と「iso-8859-1」は同じものを指し、エンコー
   ディング名「Q」と「q」は同じものを指すわけです。
|    An encoded-word may not be more than 75 characters long, including
|    charset, encoding, encoded-text, and delimiters.  If it is desirable
|    to encode more text than will fit in an encoded-word of 75
|    characters, multiple encoded-words (separated by CRLF SPACE) may be
|    used.
   encoded-word の長さは、文字セット、エンコード方式、エンコードされたテ
   キスト、デリミタを含めて、 75 文字以内にします。テキストをエンコード
   したテキストの長さが 75 文字で収まりきらない場合には、 ( CRLF または
   空白文字で区切られた)複数の encoded-word に分割します。
|    While there is no limit to the length of a multiple-line header
|    field, each line of a header field that contains one or more
|    encoded-words is limited to 76 characters.
   ヘッダフィールドは、複数行にわたって記述できるので、複数の encoded-word
   を含むメッセージヘッダ行の1行の長さは、 76 文字以内に制限されていま
   す。
|    The length restrictions are included not only to ease
|    interoperability through internetwork mail gateways, but also to
|    impose a limit on the amount of lookahead a header parser must employ
|    (while looking for a final ?= delimiter) before it can decide whether
|    a token is an encoded-word or something else.
   長さの制限は、ネットワーク間を結ぶメールゲートウェイでの処理を簡単に
   するだけでなく、ヘッダのパーサがトークンの解析をして encoded-word を
   見分ける場合に、 ( encoded-word の終了デリミタの ?= を探すために ) ス
   キャンしなくてはならない文字数を限定できます。
|    The characters which may appear in encoded-text are further
|    restricted by the rules in section 5.
   エンコードされたテキストに出現する文字には、第 5 章で述べられている規
   則で制限が加えられています。
| 3. Character sets
3. 文字セット
|    The "charset" portion of an encoded-word specifies the character set
|    associated with the unencoded text.  A charset can be any of the
|    character set names allowed in an RFC 1521 "charset" parameter of a
|    "text/plain" body part, or any character set name registered with
|    IANA for use with the MIME text/plain content-type [3].  (See section
|    7.1.1 of RFC 1521 for a list of charsets defined in that document).
   encoded-word の「charset」の部分には、エンコード前のテキストの文字セッ
   トを指定しています。この charset には、 RFC 1521 での「text/plain」ボ
   ディ・パートのパラメータ「charset」に使える文字セット名、もしくは IANA
   で MIME の text/plain コンテントタイプ用に登録されている文字セットを
   使うことができます [3] (RFC 1521 の 7.1.1 節にある charsets を定義し
   たリストを参照してください)。
|    Some character sets use code-switching techniques to switch between
|    "ASCII mode" and other modes.  If unencoded text in an encoded-word
|    contains control codes to switch out of ASCII mode, it must also
|    contain additional control codes such that ASCII mode is again
|    selected at the end of the encoded-word.  (This rule applies
|    separately to each encoded-word, including adjacent encoded-words
|    within a single header field.)
   文字セットには、「ASCII モード」とそれ以外のモードとの間でモードを切
   り替えるコード切り替えのテクニックを使っているものもあります。このよ
   うな文字セットのテキストをエンコードした場合に、 ASCII モードから他の
   モードに移行している場合には、 encoded-word の最後に ASCII モードに復
   帰する制御コードを含むようにしてください。 (この規則は、各 encoded-word
   毎に適用され、ひとつのヘッダが複数の encoded-word に分けられる場合に
   もあてはまります)。
|    When there is a possibility of using more than one character set to
|    represent the text in an encoded-word, and in the absence of private
|    agreements between sender and recipients of a message, it is
|    recommended that members of the ISO-8859-* series be used in
|    preference to other character sets.
   複数の文字セットのテキストが encoded-word にエンコードされる可能性が
   ある場合で、かつ送信者と受信者との間に個人的なとりきめがなされていな
   い場合には、これらすべての文字セットを包含する ISO-8859-* シリーズの
   上位文字セットを選択するようにします。
| 4. Encodings
4. エンコーディング
|    Initially, the legal values for "encoding" are "Q" and "B".  These
|    encodings are described below.  The "Q" encoding is recommended for
|    use when most of the characters to be encoded are in the ASCII
|    character set; otherwise, the "B" encoding should be used.
|    Nevertheless, a mail reader which claims to recognize encoded-words
|    MUST be able to accept either encoding for any character set which it
|    supports.
   今のところ「エンコード方式」として使えるのは、「Q」、「B」のみです。
   これらのエンコード方式については、後で説明します。「Q」エンコード方式
   を適用できるのは、エンコードした文字列のほとんどが ASCII 文字セットに
   なる場合のみです。それ以外の場合には、「B」エンコード方式を適用すべき
   です。しかしながら、 encoded-word の対応しているメールリーダでは、任
   意の文字セットの encoded-word に対して、両方のエンコード方式をサポー
   トしている必要があります。
|    Only a subset of the printable ASCII characters may be used in
|    encoded-text.  Space and tab characters are not allowed, so that the
|    beginning and end of an encoded-word are obvious.  The "?" character
|    is used within an encoded-word to separate the various portions of
|    the encoded-word from one another, and thus cannot appear in the
|    encoded-text portion.  Other characters are also illegal in certain
|    contexts.  For example, an encoded-word in a "phrase" preceding an
|    address in a From header field may not contain any of the "specials"
|    defined in RFC 822.  Finally, certain other characters are disallowed
|    in some contexts, to ensure reliability for messages that pass
|    through internetwork mail gateways.
   encoded-word として使えるのは、表示可能な ASCII 文字のサブセットのみ
   です。 encoded-word の区切りを明らかにするために、空白文字とタブ文字
   は encoded-word 内では使えません。「?」文字は、encoded-word 内のパー
   トの区切りとして使われます。したがって、エンコードされたテキスト内で
   は使えません。その他にも、いくつかの文字が encoded-word 内で使うこと
   ができなくなっています。たとえば、 From ヘッダでアドレスの記述の前に
   ある「phrase」の部分には、 RFC822 で規定されている「specials」に属す
   る文字は、使うことができません。さらに、インターネットでメールゲート
   ウェイ経由のメッセージの安全性のために使うことのできない文字もありま
   す。
|    The "B" encoding automatically meets these requirements.  The "Q"
|    encoding allows a wide range of printable characters to be used in
|    non-critical locations in the message header (e.g., Subject), with
|    fewer characters available for use in other locations.
   「B」エンコード方式では、これらの要求を自動的にみたしています。「Q」
   エンコード方式では、メッセージヘッダのなかでも影響を受けにくい場所
   (たとえば、 Subject フィールド)では、様々な表示可能な文字が使えますが、
   それ以外の場所では、ごく限られた文字のみが使えます。
| 4.1. The "B" encoding
4.1. Bエンコード方式
|    The "B" encoding is identical to the "BASE64" encoding defined by RFC
|    1521.
   B エンコード方式では、 RFC1521 で規定されている「BASE64」エンコード方
   式と同じです。
| 4.2. The "Q" encoding
4.2. Qエンコード方式
|    The "Q" encoding is similar to the "Quoted-Printable" content-
|    transfer-encoding defined in RFC 1521.  It is designed to allow text
|    containing mostly ASCII characters to be decipherable on an ASCII
|    terminal without decoding.
   Q エンコード方式は、 RFC1521 で content-transfer-encoding として規定
   されている「Quoted-Printable」とほぼ同じです。このエンコード方式は、
   ASCII 文字を多く含めることで ASCII 端末上でデコードしなくてもある程度
   解読できるようなテキストを生成するために考案されました。
|    (1) Any 8-bit value may be represented by a "=" followed by two
|        hexadecimal digits.  For example, if the character set in use
|        were ISO-8859-1, the "=" character would thus be encoded as
|        "=3D", and a SPACE by "=20".  (Upper case should be used for
|        hexadecimal digits "A" through "F".)
   (1) 8 ビット値は、「=」で始まる 2 桁の 16 進数で表現されます。たとえ
       ば、``ISO-8859-1''文字セットにおいて、「=」は「=3D」、空白文字は
       「=20」としてエンコードされます。 ( 16 進数には、アルファベットの
       大文字を使います。)
|    (2) The 8-bit hexadecimal value 20 (e.g., ISO-8859-1 SPACE) may be
|        represented as "_" (underscore, ASCII 95.).  (This character may
|        not pass through some internetwork mail gateways, but its use
|        will greatly enhance readability of "Q" encoded data with mail
|        readers that do not support this encoding.)  Note that the "_"
|        always represents hexadecimal 20, even if the SPACE character
|        occupies a different code position in the character set in use.
   (2) 8 ビットの 16 進数で 20 に相当する文字(``ISO-8859-1'' では空白文
       字)は、「_」( ASCII 95 でのアンダースコア)で表現されます。 (この
       文字を通さないネットワーク間メールゲートウェイも存在しますが、こ
       の文字を使うことで、このエンコード方式をサポートしていないメール
       リーダにおいて、「Q」エンコードされたデータの可読性を高めることが
       できます。) 「_」文字は、 16 進コード 20 に相当する文字を表現した
       もので、空白文字を違うコードに割り当てた文字セットでは、空白文字
       を表現したものでないことに注意してください。
|    (3) 8-bit values which correspond to printable ASCII characters other
|        than "=", "?", "_" (underscore), and SPACE may be represented as
|        those characters.  (But see section 5 for restrictions.)
   (3) その文字セットに含まれる8ビット値で表現される文字のうち、「=」、
       「?」、「_」(アンダースコア)、空白文字以外で、表示可能な ASCII コー
       ド文字に対応するものがある場合には、その対応する文字を encoded-word
       として使います。 (ただし、第5章にある制限について参照のこと)。
| 5. Use of encoded-words in message headers
5. メッセージヘッダでの encoded-word の使い方
|    An encoded-word may appear in a message header or body part header
|    according to the following rules:
   メッセージヘッダや、ボディヘッダで使われる encoded-word は、次のよう
   なルールに従います。
|    (1) An encoded-word may replace a "text" token (as defined by RFC
|        822) in any Subject or Comments header field, any extension
|        message header field, or any RFC 1521 body part field for which
|        the field body is defined as "*text".  An encoded-word may also
|        appear in any user-defined ("X-") message or body part header
|        field.
   (1) encoded-word は、 Subject または、 Comments ヘッダフィールド、拡
       張ヘッダフィールド、フィールドボディが「*text」と定義されている
       RFC1521 のボディパート・フィールドの任意の場所で「text」トークン
       になります。 encoded-word は、ユーザ定義の(「X-」)メッセージ、ボ
       ディパードのヘッダフィールドでも使えます。
|        Ordinary ASCII text and encoded-words may appear together in the
|        same header field.  However, an encoded-word that appears in a
|        header field defined as "*text" MUST be separated from any
|        adjacent encoded-word or "text" by linear-white-space.
       本来の ASCII からなるテキストと encoded-word は、同一のヘッダフィー
       ルドに共存できます。しかしながら、ヘッダフィールドに「*text」とし
       て出現する encoded-word は、隣接する encoded-word や「text」と連
       続した空白文字列で分割しなくてはいけません。
|    (2) An encoded-word may appear within a comment delimited by "(" and
|        ")", i.e., wherever a "ctext" is allowed.  More precisely, the
|        RFC 822 ABNF definition for "comment" is amended as follows:
   (2) encoded-word は、「(」、「)」で仕切られたコメント、つまり「ctext」
       中の任意の場所でも使えます。「comment」を RFC822 の ABNF 文法でよ
       り正確に定義すると次のようになります。
|        comment = "(" *(ctext / quoted-pair / comment / encoded-word) ")"
       comment = "(" * (ctext / quoted-pair / comment / encoded-word) ")"
|        A "Q"-encoded encoded-word which appears in a comment MUST NOT
|        contain the characters "(", ")" or " encoded-word that appears in
|        a "comment" MUST be separated from any adjacent encoded-word or
|        "ctext" by linear-white-space.
       comment 中に出現する「Q」エンコードされた encoded-word には、
       「(」、「)」、「\」を使えません。「comment」中の encoded-word は、
       隣接する encoded-word 、「ctext」とは連続した空白文字列で仕切られ
       ていなくてはなりません。
|    (3) As a replacement for a "word" entity within a "phrase", for
|        example, one that precedes an address in a From, To, or Cc
|        header.  The ABNF definition for phrase from RFC 822 thus
|        becomes:
   (3) From 、 To 、 Cc のフィールドでアドレスの前に記述される RFC822 で
       の「word」のかわりに、「phrase」が定義されています。 phrase は、
       ABNF で次のように定義されます。
|        phrase = 1*(encoded-word / word)
       phrase = 1*(encoded-word / word)
|        In this case the set of characters that may be used in a "Q"-
|        encoded encoded-word is restricted to: .  An encoded-word that appears
|        within a "phrase" MUST be separated from any adjacent "word",
|        "text" or "special" by linear-white-space.
       この使い方をする場合、「Q」エンコード方式の encoded-word は、次の
       ような制限を受けます。
       
少し抜けてる? - yotti 
|    These are the ONLY locations where an encoded-word may appear.  In
|    particular, an encoded-word MUST NOT appear in any portion of an
|    "addr-spec".  In addition, an encoded-word MUST NOT be used in a
|    Received header field.
   以上の場所でのみ encoded-word を使うことができます。特に「addr-spec」
   の中では、使えません。また、 Received ヘッダフィールドでも使えません。
|    Each encoded-word MUST encode an integral number of octets.  The
|    encoded-text in each encoded-word must be well-formed according to
|    the encoding specified; the encoded-text may not be continued in the
|    next encoded-word.  (For example, "=?charset?Q?=?= =?charset?Q?AB?="
|    would be illegal, because the two hex digits "AB" must follow the "="
|    in the same encoded-word.)
   各 encoded-word は、8ビット毎で1つの数にエンコードされなければなりま
   せん。各 encoded-word 中の encoded-text は、エンコード規則において正
   規のものでなければなりません。また次の encoded-word に続いていてはい
   けません。 (たとえば「=?charset?Q?=?= =?charset?Q?AB?=」は、 16 進数
   を表す「AB」が「=」の直後にないので、この規則に違反しています。)
|    Each encoded-word MUST represent an integral number of characters. A
|    multi-octet character may not be split across adjacent encoded-words.
   各 encoded-word は、1文字単位でエンコードされなければなりません。マル
   チバイト文字を使う場合には、1つの文字が隣接する encoded-word にわたっ
   て分割されてはいけません。
|    Only printable and white space character data should be encoded using
|    this scheme.  However, since these encoding schemes allow the
|    encoding of arbitrary octet values, mail readers that implement this
|    decoding should also ensure that display of the decoded data on the
|    recipient's terminal will not cause unwanted side-effects.
   これらのエンコード方式は、表示可能な文字と空白文字からなるテキストデー
   タに対してのみ適用されるべきです。しかし、これらのエンコード方式は、
   8 ビットのデータをエンコードすることもできるので、デコードができるメー
   ルリーダを実装する場合には、受信者の端末で表示がされるときに不本意な
   副作用が起きないように保証すべきです。
|    Use of these methods to encode non-textual data (e.g., pictures or
|    sounds) is not defined by this memo.  Use of encoded-words to
|    represent strings of purely ASCII characters is allowed, but
|    discouraged.  In rare cases it may be necessary to encode ordinary
|    text that looks like an encoded-word.
   非テキストのデータ(たとえば、絵や音声)をエンコードする場合の、この方
   式の適用についてはこのメモで定義されていません。純粋な ASCII 文字だけ
   を表現する encoded-word も作ることができますが、普通はしません。
   encoded-word の形式にする必要があまりないからです。
| 6. Support of encoded-words by mail readers
6. メールリーダにおけるencoded-wordのサポート
| 6.1. Recognition of encoded-words in message headers
6.1. メッセージヘッダ内でのencoded-wordの認識
|    A mail reader must parse the message and body part headers according
|    to the rules in RFC 822 to correctly recognize encoded-words.
   メールリーダは RFC 822 の規則に従ってメッセージとボディパート・ヘッダ
   をパースし、 encoded-word を正しく認識しなくてはいけません。
|    Encoded-words are to be recognized as follows:
   encode-word は、以下のようにして認識されます。
|    (1) Any message or body part header field defined as "*text", or any
|        user-defined header field, should be parsed as follows: Beginning
|        at the start of the field-body and immediately following each
|        occurrence of linear-white-space, each sequence of up to 75
|        printable characters (not containing any linear-white-space)
|        should be examined to see if it is an encoded-word according to
|        the syntax rules in section 2.  Any other sequence of printable
|        characters should be treated as ordinary ASCII text.
   (1) 「*text」として定義されるメッセージ、ボディパート・ヘッダ、ユーザ
       定義のヘッダフィールドは、以下のようにパースされます。まず、フィー
       ルドのボディの起点直後にある連続する空白文字列を除いた最長 75 文
       字の(空白文字を1つも含まない)表示可能な文字列に対して、第 2 節で
       示した構文にあてはまる encoded-word があるかどうか調べます。この
       構文にあてはまらない表示可能な文字列については、字面どおりの ASCII
       文字列とみなされます。
|    (2) Any header field not defined as "*text" should be parsed
|        according to the syntax rules for that header field.  However,
|        any "word" that appears within a "phrase" should be treated as an
|        encoded-word if it meets the syntax rules in section 2.
|        Otherwise it should be treated as an ordinary "word".
   (2) 「*text」として定義されていないヘッダフィールドは、そのヘッダフィー
       ルド特有の構文規則でパースされます。しかし、「phrase」内に出現する
       「word」が第2節にある構文規則に合致する場合には、これを encoded-word
       として扱うべきです。それ以外の場合には、本来の「word」として扱います。
|    (3) Within a "comment", any sequence of up to 75 printable characters
|        (not containing linear-white-space), that meets the syntax rules
|        in section 2, should be treated as an encoded-word.  Otherwise it
|        should be treated as normal comment text.
   (3) 「comment」中の、(空白を含まない)最長75文字の表示可能な文字列で
       第 2 節の構文に合致するものがあれば、 encoded-word として扱います。
       それ以外の場合は、通常の comment テキストとして扱います。
| 6.2. Display of encoded-words
6.2. encoded-wordsの表示
|    Any encoded-words so recognized are decoded, and if possible, the
|    resulting unencoded text is displayed in the original character set.
   デコードできる任意の encoded-word は、可能なかぎり元の文字セットで表
   示されます。
|    When displaying a particular header field that contains multiple
|    encoded-words, any linear-white-space that separates a pair of
|    adjacent encoded-words is ignored.  (This is to allow the use of
|    multiple encoded-words to represent long strings of unencoded text,
|    without having to separate encoded-words where spaces occur in the
|    unencoded text.)
   複数の encoded-word を含むようなフィールドの表示において、 encoded-word
   の間にある連続する空白文字列は無視されます。 (これにより、長いテキス
   トをエンコードする際に、複数の encode-word 間に不必要な空白を狭むこと
   なしに、これを表現することができます。)
|    In the event other encodings are defined in the future, and the mail
|    reader does not support the encoding used, it may either (a) display
|    the encoded-word as ordinary text, or (b) substitute an appropriate
|    message indicating that the text could not be decoded.
   将来、新たなエンコード方式が定義され、メールリーダがそのエンコーディ
   ングをサポートしていない場合には、次のどちらかをします。
   (a) encoded-word のテキストをエンコードされたまま表示する。
   (b) デコードできないことを示すメッセージを表示する。
|    If the mail reader does not support the character set used, it may
|    (a) display the encoded-word as ordinary text (i.e., as it appears in
|    the header), (b) make a "best effort" to display using such
|    characters as are available, or (c) substitute an appropriate message
|    indicating that the decoded text could not be displayed.
   メールリーダのサポートしていない文字セットが使われている場合には、次
   のどちらかが行なわれます。
   (a) (ヘッダにある) encoded-word のテキストをエンコードされたまま表示する。
   (b) できうる限りの「努力」をして表示できる分だけでも表示する。
   (c) デコードしたテキストが表示できないことを示すメッセージを表示する。
|    If the character set being used employs code-switching techniques,
|    display of the encoded text implicitly begins in "ASCII mode".  In
|    addition, the mail reader must ensure that the output device is once
|    again in "ASCII mode" after the encoded-word is displayed.
   コード切り替えのテクニックを使っている文字セットでは、エンコードされ
   ているテキストの表示は、暗黙的に「ASCII モード」から始めます。それに
   加えてメールリーダは、各 encoded-word の表示を終えたら、「ASCII モード」
   に戻っていることを保証しなくてはなりません。
| 6.3. Mail reader handling of incorrectly formed encoded-words
6.3. 正しい形式でないencoded-wordのメールリーダでの取り扱い
|    It is possible that an encoded-word that is legal according to the
|    syntax defined in section 2, is incorrectly formed according to the
|    rules for the encoding being used.   For example:
   第 2 節で定義されている構文に従う encoded-word には、適用されたエンコー
   ド方式の規則により、形式のうえで正しくないものがありえます。
|    (1) An encoded-word which contains characters which are not legal for
|        a particular encoding (for example, a '-' in the "B" encoding),
|        is incorrectly formed.
   (1) 特定のエンコード方式において有効でない文字 (たとえば、「B」エンコー
       ディングでの '-') を含んでいて正しくないもの。
|    (2) Any encoded-word which encodes a non-integral number of
|        characters or octets is incorrectly formed.
   (2) encoded-word において、文字もしくは、 8 ビットのデータ毎にエンコー
       ドがなされていないもの。
|    A mail reader need not attempt to display the text associated with an
|    encoded-word that is incorrectly formed.  However, a mail reader MUST
|    NOT prevent the display or handling of a message because an encoded-
|    word is incorrectly formed.
   メールリーダは、正しい形式になっていない encoded-word を無理に表示す
   る必要はありません。しかし、たとえそれが正しい形式になっていなくとも、
   メールリーダはそのメッセージ全体の表示や処理をやめてはいけません。
| 7. Conformance
7. 規則
|    A mail composing program claiming compliance with this specification
|    MUST ensure that any string of non-white-space printable ASCII
|    characters within a "*text" or "*ctext" that begins with "=?" and
|    ends with "?=" be a valid encoded-word.  ("begins" means: at the
|    start of the field-body or immediately following linear-white-space;
|    "ends" means: at the end of the field-body or immediately preceding
|    linear-white-space.) In addition, any "word" within a "phrase" that
|    begins with "=?" and ends with "?=" must be a valid encoded-word.
   この仕様書の要求をみたすメール編集プログラムは、「*text」、「*ctext」
   内の文字で「=?」で始まり、「=?」で終る空白文字列でない表示可能な
   ASCII 文字列が、有効な encoded-word であることを保証する必要がありま
   す。 (ここで言う「始まる」とは、フィールドボディの起点と、空白文字列
   の直後の状態をさし、「終る」とはフィールドボディの終りと、空白文字列
   の直前の状態をさします。)
|    A mail reading program claiming compliance with this specification
|    must be able to distinguish encoded-words from "text", "ctext", or
|    "word"s, according to the rules in section 6, anytime they appear in
|    appropriate places in message headers.  It must support both the "B"
|    and "Q" encodings for any character set which it supports.  The
|    program must be able to display the unencoded text if the character
|    set is "US-ASCII".  For the ISO-8859-* character sets, the mail
|    reading program must at least be able to display the characters which
|    are also in the ASCII set.
   この仕様書の要求をみたすメールを読むためのプログラムは、メッセージヘッ
   ダの適切な場所に出現した encoded-word を第 6 節で定義した規則により
   「text」、「ctext」、「word」を区別できる必要があります。サポートする
   文字セットについては、「B」と「Q」両方のエンコーディング方式をサポー
   トしていなければなりません。またプログラムは、デコードしたテキストの
   文字セットが「US-ASCII」である場合には、表示できなくてはなりません。
   メールを読むためのプログラムは、``ISO-8859-*''の文字セットについても
   その中で ASCII 文字に該当する文字のある文字については、すくなくとも表
   示できるようになっていなくてはなりません。
| 8. Examples
8. 例
|       From: =?US-ASCII?Q?Keith_Moore?= 
|       To: =?ISO-8859-1?Q?Keld_J=F8rn_Simonsen?= 
|       CC: =?ISO-8859-1?Q?Andr=E9_?= Pirard 
|       Subject: =?ISO-8859-1?B?SWYgeW91IGNhbiByZWFkIHRoaXMgeW8=?=
|        =?ISO-8859-2?B?dSB1bmRlcnN0YW5kIHRoZSBleGFtcGxlLg==?=
|       From: =?ISO-8859-1?Q?Olle_J=E4rnefors?= 
|       To: ietf-822@dimacs.rutgers.edu, ojarnef@admin.kth.se
|       Subject: Time for ISO 10646?
|       To: Dave Crocker 
|       Cc: ietf-822@dimacs.rutgers.edu, paf@comsol.se
|       From: =?ISO-8859-1?Q?Patrik_F=E4ltstr=F6m?= 
|       Subject: Re: RFC-HDR care and feeding
|       From: Nathaniel Borenstein 
|             (=?iso-8859-8?b?7eXs+SDv4SDp7Oj08A==?=)
|       To: Greg Vaudreuil , Ned Freed
|          , Keith Moore 
|       Subject: Test of new header generator
|       MIME-Version: 1.0
|       Content-type: text/plain; charset=ISO-8859-1
| 9. References
9. 参考文献
|    [1] Borenstein N., and N. Freed, "MIME (Multipurpose Internet Mail
|        Extensions) Part One:  Mechanisms for Specifying and Describing
|        the Format of Internet Message Bodies", RFC 1521, Bellcore,
|        Innosoft, September 1993.
|    [2] Crocker, D., "Standard for the Format of ARPA Internet Text
|        Messages", STD 11, RFC 822, UDEL, August 1982.
|    [3] Reynolds, J., and J. Postel, "Assigned Numbers", STD 2,
|        RFC 1340, USC/Information Sciences Institute, July 1992.
| 10. Security Considerations
10. セキュリティに関する考察
|    Security issues are not discussed in this memo.
   このメモでは、議論されていません。
| 11. Author's Address
11. 著者連絡先
|    Keith Moore
|    University of Tennessee
|    107 Ayres Hall
|    Knoxville TN 37996-1301
|    EMail: moore@cs.utk.edu
              
一覧
スポンサーリンク







