話し手から発せられた音波の「どの特徴」を聞き手が耳で捉え、正しい音声として識別をするのか、という仮説について、これまでの有力な仮説は、聞き手は話し手からの音波の「示差的特徴(distinctive features:DF)」を捉える、という二項対立理論(英語: binary opposition hypothesis)がある[1]。
例えば、日本語の /n/ の音について考えられたい。/n/ の音は軟口蓋を下げて、呼気が口腔ではなく、鼻腔を通って外に流れ出ることで調音される有声歯茎鼻音である。鼻腔の方から空気が流れ出る音は鼻音なので、鼻音であるという事を意味する
という示差的特徴を有する事になる。これは弁別的素性とも呼ばれている。つまり、このような示差的特徴を正しく認識することが出来れば、その音を正しく識別できたといってもいい、ということになる。
Jakobson et al(1952)の仮説では、12個のDFがあれば、世界のすべての言語の音声体系が記述できるという。この仮説は、その後さらに多くの新しい言語の音声体系が研究され、現在ではHalle and Clements(1983)の仮説によれば、20個のDFが必要になるという[1]。