KOI8-R

From Wikipedia, the free encyclopedia

KOI8-Rロシア語キリル文字を扱うよう設計された、8ビットの文字コードである。ブルガリア語も扱える。ここから派生したKOI8-Uには、ウクライナ語の文字が追加されている。最初のKOI-8符号はソビエト当局により1974年に設計された。

KOI8はISO 8859-5よりもはるかに広く使われ続けている。ISO 8859-5が人気だったことはない。他のよく知られたキリル語文字コードはWindows-1251である。キリル語を他の非ラテン言語と一緒に表現する方法としてUnicodeがある。

KOI8はロシア語でKod Obmena Informatsiey, 8 bit (Код Обмена Информацией, 8 бит) の略であり、「情報交換用符号、8ビット」という意味である。

KOIシリーズの文字集合におけるロシア語のキリル文字は、ISO 8859-5のような自然なキリル文字のアルファベット順ではなく、主に発音の対応するASCIIのラテン文字の符号位置の順で並べられているという特性を持つ。さらに、大文字と小文字の符号位置は逆になっている。これは一見して不自然に見えるが、8ビット目が欠落する文字化けに対処できるという利点がある。たとえば、KOI8-Rで表現した"Русский Текст" (ラテン文字転写例: Russkij Tjekst)は8ビット目を落とすと"rUSSKIJ tEKST"になる。大文字と小文字が逆になることで文字化けが発生したことが分かり、文字の発音も近いため、そのまま読めるか、少なくとも復元することはできる。また、これは正しいKOI-7として解釈できる。ASCII文字列"rUSSKIJ tEKST"をKOI-7(КОИ-7 Н1)として解釈すれば"Русский Текст"である。一方で、文字コードでソートしても正しいキリル文字の順序にならないという欠点もある。

さらに見る x0, x1 ...
KOI8-R
x0x1x2x3x4x5x6x7x8x9xAxBxCxDxExF
0x 制御文字
1x
2x SP!"#$%&'()*+,-./
3x 0123456789:;<=>?
4x @ABCDEFGHIJKLMNO
5x PQRSTUVWXYZ[\]^_
6x `abcdefghijklmno
7x pqrstuvwxyz{|}~
8x
9x NBSP°²·÷
Ax ё
Bx Ё©
Cx юабцдефгхийклмно
Dx пярстужвьызшэщчъ
Ex ЮАБЦДЕФГХИЙКЛМНО
Fx ПЯРСТУЖВЬЫЗШЭЩЧЪ
閉じる

外部リンク

  • RFC 1489
  • All about KOI8-R (英語)
  • Universal Cyrillic decoder (英語) 壊れたKOI8-Rや他の文字コードで書かれたキリル文字の文章の修復を手助けするオンラインのプログラム。
  • キリル文字符号化の小史 (英語)

Related Articles

Wikiwand AI