メインコンテンツまでスキップ

8. MIME registration (MIME登録)

登録の基礎 (Registration Basis)

本メモは、[RFC2978]に従って、UTF-8のMIME charsetパラメータの登録の基礎として機能します。charsetパラメータ値は"UTF-8"です。

メディアタイプのラベリング (Media Type Labeling)

この文字列は、少なくとも1993年版の修正第5版(韓国ブロック)までのすべての修正を含む、ISO/IEC 10646のレパートリーからの文字で構成されるテキストを含むメディアタイプをラベル付けし、上記で概説したエンコーディングスキームを使用してオクテットのシーケンスにエンコードされます。

UTF-8は、"text"トップレベルタイプの下でMIMEコンテンツタイプでの使用に適しています。

バージョン非依存ラベルの根拠 (Version-Independent Label Rationale)

ラベル"UTF-8"にバージョン識別が含まれておらず、ISO/IEC 10646を一般的に参照していることは注目に値します。これは意図的なものであり、その根拠は以下のとおりです:

MIME charsetラベルの目的 (Purpose of MIME Charset Labels)

MIME charsetラベルは、ネットワーク上で受信したバイトシーケンスを文字のシーケンスに解釈するために必要な情報だけを提供するように設計されており、それ以上のものではありません([RFC2045]、セクション2.2を参照)。

文字セット標準が非互換に変更されない限り、バージョン番号は目的を果たしません。タグから新しく割り当てられた文字が受信される可能性があることを知っても、それについて知らないことを学ぶことで何も得られないからです。タグ自体は、いずれにしても受信される新しい文字については何も教えてくれません。

利点と欠点 (Advantages vs. Drawbacks)

したがって、標準が互換的に進化する限り、バージョンを識別するラベルを持つ明白な利点は、見かけだけのものです。

しかし、そのようなバージョン依存ラベルには欠点があります:古いアプリケーションが新しい未知のラベルを伴うデータを受信すると、ラベルを認識できず、データを処理できない可能性がありますが、一方で、一般的な既知のラベルであれば、新しい文字を含まない可能性のあるデータのほとんど正しい処理をトリガーしたでしょう。

「韓国の混乱」の例外 (The "Korean Mess" Exception)

さて、「韓国の混乱」(ISO/IEC 10646修正第5版)は非互換な変更であり、原則として上記のようなバージョン非依存MIME charsetラベルの適切性と矛盾します。

しかし、互換性の問題は、Unicode 1.1(または同等にISO/IEC 10646修正第5版以前)に従ってエンコードされた韓国のハングル文字を含むデータでのみ現れる可能性があり、心配するそのようなデータはおそらく存在しません。これが、非互換な変更が受け入れられると見なされた理由そのものです。

将来の非互換な変更 (Future Incompatible Changes)

したがって、実際には、以下の条件が満たされる場合、バージョン非依存ラベルが正当化されます:

  • ラベルは修正第5版以降のすべてのバージョンを参照すると理解されること
  • 非互換な変更が実際には発生しないこと

ISO/IEC 10646の後のバージョンで非互換な変更が発生した場合、ここで定義されたMIME charsetラベルは、IETFが特に別の決定をしない限り、以前のバージョンと整合性を保ちます。


関連リンク