Loi de Menzerath
From Wikipedia, the free encyclopedia
La loi de Menzerath, ou loi de Menzerath-Altmann est un principe de linguistique quantitative selon lequel plus un constituant linguistique est grand (en nombre d’éléments), plus ses sous-constituants tendent à être petits[1],[2]. Elle est baptisée ainsi en référence à Paul Menzerath et Gabriel Altmann.
Selon cette loi, par exemple, plus une phrase est longue (mesurée en nombre de propositions), plus les propositions sont courtes (mesurées en nombre de mots), ou : plus un mot est long (en syllabes ou en morphèmes), plus les syllabes ou les morphèmes sont courts en sons.
Histoire
Au XIXe siècle, Eduard Sievers a observé que les voyelles des mots courts sont prononcées plus longtemps que les mêmes voyelles dans les mots longs[3](p122). Menzerath et de Oleza (1928) ont étendu cette observation pour affirmer que, lorsque le nombre de syllabes dans les mots augmente, les syllabes elles-mêmes deviennent plus courtes en moyenne.
De là est née l'hypothèse linguistique suivante :
Plus une construction linguistique est longue, plus ses constituants sont courts.
Au début des années 1980, Altmann, Heups et Köhler[4] ont démontré, à l'aide de méthodes quantitatives, que ce postulat pouvait également s'appliquer à des constructions plus larges du langage naturel : plus la phrase est longue, plus les propositions individuelles sont courtes, etc. Une condition préalable à de telles relations est l'examen d'une relation entre les unités (ici : la phrase) et leurs constituants directs (ici : la proposition)[5],[6],[1].
Formalisation
La loi s’exprime souvent par la formule proposée par Altman (1980)[5] :où:
- est la taille moyenne de l'unité inférieure (ex. le nombre moyen de mots par proposition) ;
- est la taille de l’unité supérieure (ex. nombre de propositions par phrase);
- , , sont des paramètres à ajuster.
Exemples
Chen (2018) tente de mesurer la force de la loi de Menzerath pour le chinois[7]. Ses résultats vont dans le sens de cette loi et suggèrent donc qu'en chinois écrit, plus une phrase est longue (en propositions), plus chaque proposition est courte en moyenne.