Test de Banerji (statistiques)
From Wikipedia, the free encyclopedia
| Type |
|---|
Le test de Banerji[1] est un test statistique utilisé en économie pour déterminer si une série économique possède une avance ou un retard significatif sur une autre série, du point de vue des points de retournement.
Une série économique est un ensemble de valeurs économiques dépendant du temps, comme la quantité produite d'un bien, le volume d'échange de valeurs, ou bien des indicateurs économiques (comme le produit intérieur brut)… Une série présente en général des cycles alternés de croissance et de décroissance ; un point de retournement est la transition entre croissance et décroissance — il s'agit alors d'un maximum local de la série (point haut) — ou bien entre décroissance et croissance — il s'agit alors d'un minimum local de la série (point bas).
Un phénomène économique a souvent des répercussions sur d'autres. On va alors observer des parallèles sur les formes des séries. Naïvement, on peut dire que :
- si deux séries ont des cycles synchronisés, si leurs points de retournement sont sensiblement aux mêmes dates, alors ils dépendent d'un troisième phénomène commun ;
- si une série est en retard sur l'autre, alors soit elle dépend de la première, soit elles dépendent toutes les deux d'un même phénomène, mais il existe un mécanisme « tampon » qui retarde la répercussion sur le deuxième série ; et surtout, on peut envisager de prédire les points de retournement de la deuxième série en fonction de ceux de la première.
Banerji considère en particulier les indicateurs économique avancés — c'est-à-dire dont les points de retournement sont en avance par rapport aux autres indicateurs —, comme le LEI (leading economic index (en)), établi par The Conference Board (en), et composé à partir de 10 valeurs. Cet indice est censé pouvoir indiquer les points de retournement de l'économie, mais rien d'autre, et en particulier pas l'intensité des phénomènes ni ce qui se passe entre les points de retournement.
Notons que pour être pertinent, un indicateur économique avancé doit être :
- stable : sa définition ne doit pas changer, ce qui permet de comparer ses valeurs sur de longues périodes (voir par exemple les polémiques sur les chiffres du chômage) ;
- disponible rapidement, ce qui permet de détecter rapidement un retournement.
On peut difficilement faire une hypothèse sur la loi statistique que suit le point de retournement d'un indicateur. On s'oriente donc vers un test non paramétrique (qui n'est pas basé sur une loi). Par ailleurs, comme il s'agit de comparer des points deux à deux (les points de retournement de deux séries), on s'intéresse aux tests de comparaison par paires. Les tests les plus intéressants considèrent que les échelles de valeur sont uniformes, c'est-à-dire qu'un intervalle donné correspond à la même différence quel que soit l'endroit où l'on se trouve ; c'est le cas des indicateurs, puisqu'ils sont relevés à intervalles réguliers (tous les mois ou tous les trimestres).
Hypothèse testée
L'hypothèse nulle du test de Banerji est l'absence d'avance.
Tests utilisés
Test de casualisation des paires
Le test de casualisation (randomisation) des paires est fondé sur la considération suivante :
- soit ui la suite des dates de retournement de la première série, et vi celle de la deuxième série ;
- on appelle S la somme des écarts : S = Σ(ui – vi) ;
- si l'hypothèse nulle est vérifiée, alors la somme des écarts est nulle (ou plutôt, n'est pas significativement non nulle) :
- H0 : S = 0,
- H1 : S > 0.
La première étape consiste donc à calculer les écarts entre les dates des points de retournement. Supposons que l'on ait n points, donc n écarts entre les deux séries, n différences. Si l'hypothèse nulle est vérifiée, alors chaque différence a une chance sur deux d'être positive, et réciproquement 1/2 d'être négative. Il y a deux possibilités de signe pour chacun des n écarts, donc 2n possibilités.
La deuxième étape consiste à calculer la somme des écarts S, puis à calculer toutes les sommes possibles en changeant les signes des écarts :
- somme lorsque tous les écarts sont positifs ;
- sommes lorsqu'un écart est négatif ;
- sommes lorsque deux écarts sont négatifs ;
- …
- somme lorsque tous les écarts sont négatifs.
On calcule donc les sommes Sj :
- Sj = Σeji·|ui – vi|
où (eji)1 ≤ i ≤ n est une suite dans {–1 ; 1}.
Il y a donc card{–1 ; 1}n = 2n sommes (S fait partie de ces sommes). On compte le nombre de sommes qui sont supérieures ou égales à S ; soir R ce nombre. Parmi les 2n possibilités, la probabilité, sous l'hypothèse nulle, que l'on ait le cas présent ou un cas plus éloigné de 0 est R/2n :
- P(Sj ≥ S sous H0) = R/2n.
On peut donc rejeter l'hypothèse nulle avec un niveau de confiance de 1 – P(Sj ≥ S sous H0) = 1 – R/2n, ou, en pourcentages, 100 × (1 – R/2n) % :
- 1 – R/2n est la probabilité d'accepter H0 alors que H0 est fausse.
Ce test peut se faire à la main jusqu'à environ 10 points de retournement (soit 1 024 sommes à calculer). Au-delà, il faut avoir recours à un programme, l'algorithme a une complexité en O(2n).
Si l'hypothèse nulle est rejetée, cela signifie qu'une des séries est en avance sur l'autre. On peut déterminer l'avance en enlevant un pas (un mois, un trimestre) à toutes les sommes déjà calculées, jusqu'à ce que l'on tombe dans l'hypothèse nulle. Avec la même démarche, on peut valider l'hypothèse « les deux séries sont décalées de m mois ». On peut par ailleurs calculer le niveau de confiance pour un décalage de m mois, et ainsi obtenir le « profil d'avance »
- niveau de confiance = ƒ(avance)