Soit p, la probabilité de succès sur chaque essai. Cette probabilité est supposée constante mais inconnue et incertaine.
On la considère donc comme une variable aléatoire et on lui attribue une distribution de probabilité pour exprimer cette incertitude. Soit Xi ayant la valeur 1 si l’on observe un « succès » sur le ième essai, et ayant la valeur 0 dans le cas contraire. Chaque Xi a ainsi pour valeur 0 ou 1 et suit donc une distribution de Bernoulli.
On suppose que ces Xi soient conditionnellement indépendants pour une probabilité p donnée.
On peut alors utiliser le théorème de Bayes pour trouver la distribution de probabilité conditionnelle de p étant donné les données Xi (i = 1, ..., n).
Pour la mesure de la probabilité a priori de p, on attribue à cette v.a. une loi non informative de probabilité a priori, c'est-à-dire une distribution uniforme sur l’intervalle ouvert ]0;1[ ayant donc comme fonction de densité :

Pour la vraisemblance des observations
, on calcule la fonction de vraisemblance :

où s = x1 + ... + xn est le nombre de succès et n est le nombre d’essais (X en majuscule désigne la variable aléatoire et x minuscule, les données réellement observées).
En utilisant les deux définitions précédentes, on peut alors déterminer la densité de probabilité de la distribution a posteriori :

On calcule alors la constante de normalisation :

(voir la fonction bêta pour plus d’informations sur les intégrales de cette forme).
La fonction de densité de la loi a posteriori est donc :

Il s’agit d’une loi bêta ayant pour espérance mathématique :

Ainsi on a :
