コンマ
主に欧文の表記に用いる読点
From Wikipedia, the free encyclopedia
文の区切り
欧文では文の途中の区切りにもっぱらコンマが用いられる。英語のようにコンマを打つか打たないかが比較的厳密に定められている言語と、筆記者の自由に任される言語とがある。
日本語の縦書き文書では文の途中の区切りにもっぱら読点(、)を用いる。これに対して、横書き文書では読点を用いるスタイルとコンマを用いるスタイルの2つのスタイルがある。
日本語の横書きでコンマを使用する場合、次のようにベースライン上に置かれる。
- …に対して,
日本語の公用文
日本語の公用文においては、縦書きおよび横書きを問わず、読点には「、」(テン)を用いることが原則である。
2022年(令和4年)以前には、公用文においては、横書きではコンマを用いるとしていた時代があった。1952年(昭和27年)の「公用文作成の要領(2022年廃止)」においては、横書きではコンマを用いるとしていた[3]。一方、旧自治省が1959年(昭和34年)に定めた「左横書き文書の作成要領」では、横書きではコンマを用いず読点を用いるとしていた[4]。
中国語
中国語では、縦書きでもコンマを用いる。中華人民共和国では縦書きでは右上に寄せてコンマを打つことになっており、Unicode 7.0 ではこのために U+FE10 が追加された[5]。台湾や香港の中国語の文章では、縦書き・横書きを問わず、漢字1文字分のスペースの中央に置かれることも多い。
数字の区切り
コンマは、数字の桁の区切りにも使用される。
日本における桁区切り
日本における桁区切りは、次の2通りの書き方があり得る。
- 欧米および「公用文作成の要領」に従って「3桁ごと」とする[6]
- 例:1億 = 100000000 → 100,000,000
- ただし、単位の漢字と算用数字を合わせて使う場合、数字だけの場合とコンマの位置がずれることによる混乱を避けるため、コンマを省いてもよい[7]。
- 例:「1億2,644万3,000人」または「1億2644万3000人」(126,443,000人)
- 万・億・兆といった単位に合わせて「4桁ごと」とする
- 例:1億 = 100000000 → 1,0000,0000 または 1'0000'0000[要出典]
実際には後者の「4桁ごと」はほとんど使われていない[要出典]。
英語圏諸国における桁区切り
英語圏諸国では、数字の3桁ごとの区切り(桁区切り)にコンマを用いる。英語では、thousand(, ten thousand, hundred thousand), million, ... と、3桁ごとに大きい数の単位が変わるため、右から thousand, million, billion, trillion と単位に置き換えて読むことができる。
| 数値 | 英語による読み方 |
|---|---|
| 1 | one |
| 10 | ten |
| 100 | one hundred |
| 1,000 | one thousand |
| 10,000 | ten thousand |
| 100,000 | one hundred thousand |
| 1,000,000 | one million |
| 10,000,000 | ten million |
| 100,000,000 | one hundred million |
| 1,000,000,000 | one billion |
| 10,000,000,000 | ten billion |
| 100,000,000,000 | one hundred billion |
| 1,000,000,000,000 | one trillion |
なお、1兆は通例 one trillion だが、one million million で表現されることもある[8]。
インドにおける桁区切り
インドにおける桁区切りには、イギリス、米国、中国などと同じく、コンマを用いるが、数字列におけるコンマの位置は独特である。現地語の位取りの読み方にしたがい、はじめの3桁(千の位)の位置、その後は2桁ごと(10万の位、1千万の位、10億の位…)にコンマを置く。
科学技術の分野
科学技術の分野では、3桁ごとの桁区切りにコンマを用いず、空白(スペース)を用いる[9]。その理由は、ヨーロッパ大陸(フランス、ドイツ、イタリア、ロシアなど)では桁区切りにピリオドを、小数点にコンマを用いるのに対し、イギリス、米国、中国、日本ではこれとは逆に、桁区切りにコンマを、小数点にピリオドを用いるので、この違いによる重大な誤読を防ぐためである[10]。詳細は小数点#二つの方式を参照のこと。
小数点
数学
プログラミング
コンピュータおよびプログラミングは、もともとアメリカ合衆国で発達したことから、アメリカ英語のスタイルの影響を強く受けている。多くのコンピュータ言語およびプログラミング言語のソースコードでは、配列のような複数のデータ集合の初期値を与える初期化子リストや、サブルーチン(関数)の引数リストといった構文における要素の区切り文字にコンマ,が使われ、実数(浮動小数点数)のリテラル表記の小数点にはピリオド.が使われる。一方、関数型プログラミング言語ではタプルの区切りにコンマを使い、コレクション要素の区切りにセミコロン;や改行を使い、関数の引数リストの区切りにスペースを使うなどといった構文仕様になっていることも多い[14][15][16]。
国際化対応の観点から、数値を文字列に変換したり、文字列を数値に変換したりする際は、コンピュータシステムの表示言語や地域といった何らかの環境設定に応じて小数点の記号が決定されるようになっていることが多い。C言語のprintf/scanfやstrtodなどは、ロケール (locale) の設定に応じて小数点の記号がピリオドまたはコンマに変化する。.NETではロケールに対応する概念はカルチャ (culture) と呼ばれている[17]。しかし、数値データをテキストファイルで読み書きする場合、もしプログラム実行環境のロケールに応じて数値変換動作におけるコンマの扱いが変わってしまうと、他の環境で作成されたファイルを読み書きする際に支障をきたす可能性がある。対策としては、テキストによる数値データのシリアライズと逆シリアライズには必ずCロケール[18]を利用する(ピリオドを小数点の記号とする)ようにプログラミングすることが挙げられる。Comma-Separated Values (CSV) のように、テキストフィールドの区切り文字にコンマを使用することが想定されているファイル形式もあるが、ロケールによっては区切り文字にセミコロンが使用される場合もある。CSVの代替として、ロケールに中立なTab-Separated Values (TSV) が使われることもある。
なお、C/C++やJavaScriptといった一部の言語では、特殊な演算子の1つとしてコンマ演算子が規定されており、コンマは区切り文字として使われるだけでなく、文脈によっては演算子としても使われる。
名称・歴史
符号位置
Unicodeで文字名称にCOMMAの含まれる文字は下記である。
| 記号 | Unicode | JIS X 0213 | 文字参照 | 名称 |
|---|---|---|---|---|
| , | U+002C | 1-1-4 | ,, | コンマ COMMA |
| , | U+FF0C | 1-1-4 | ,, | コンマ(漢字圏の用途向け) FULLWIDTH COMMA |
| ʻ | U+02BB | - | ʻʻ | MODIFIER LETTER TURNED COMMA 「ʻ」を参照 |
| ʽ | U+02BD | - | ʽʽ | MODIFIER LETTER REVERSED COMMA |
| ، | U+060C | - | ،، | ARABIC COMMA |
| ᠂ | U+1802 | - | ᠂᠂ | MONGOLIAN COMMA |
| 、 | U+3001 | - | 、、 | IDEOGRAPHIC COMMA 読点 |
| ︐ | U+FE10 | - | ︐︐ | PRESENTATION FORM FOR VERTICAL COMMA |
| ︑ | U+FE11 | - | ︑︑ | PRESENTATION FORM FOR VERTICAL IDEOGRAPHIC COMMA |
| ﹐ | U+FE50 | - | ﹐﹐ | SMALL COMMA |
| ﹑ | U+FE51 | - | ﹑﹑ | SMALL IDEOGRAPHIC COMMA |
| 、 | U+FF64 | - | 、、 | HALFWIDTH IDEOGRAPHIC COMMA |
| ፣ | U+1363 | - | ፣፣ | ETHIOPIC COMMA |
| ̒ | U+0312 | - | ̒̒ | COMBINING TURNED COMMA ABOVE |
| ̓ | U+0313 | - | ̓̓ | COMBINING COMMA ABOVE |
| ̔ | U+0314 | - | ̔̔ | COMBINING REVERSED COMMA ABOVE |
| ̕ | U+0315 | - | ̕̕ | COMBINING COMMA ABOVE RIGHT |
| ̦ | U+0326 | - | ̦̦ | COMBINING COMMA BELOW |
| ꓾ | U+A4FE | - | ꓾꓾ | LISU PUNCTUATION COMMA |
| ᠈ | U+1808 | - | ᠈᠈ | MONGOLIAN MANCHU COMMA |
| ߸ | U+07F8 | - | ߸߸ | NKO COMMA |
| ꘍ | U+A60D | - | ꘍꘍ | VAI COMMA |
| ՝ | U+055D | - | ՝՝ | ARMENIAN COMMA |
| ꛵ | U+A6F5 | - | ꛵꛵ | BAMUM COMMA |