Soient
des fonctions dérivables en
, on a alors :

Cette relation peut être démontrée par récurrence.
Démonstration
Pour
, la relation est trivialement vraie.
Nous devons maintenant montrer que si la formule est vraie pour
, alors elle est aussi vraie pour
.
Soit une fonction
définie par :

Avec
des fonctions quelconques dérivables en
.
Soit encore une fonction
, elle-même dérivable en
, la dérivée de
est alors donnée par la règle du produit :

Cela revient à écrire, avec l'hypothèse de la récurrence :

En simplifiant cette dernière expression on obtient finalement :

La formule est donc aussi vraie pour
. Par induction, la formule est donc vraie pour tous les entiers
.
Exemple :
Avec trois fonctions
,
et
, dérivables en
, on a :

Par exemple, pour trouver la dérivée de
:
![{\displaystyle {\frac {\mathrm {d} }{\mathrm {d} x}}\left[(x+1)(x^{2}+1)({\sqrt {x}}-2)\right]=(x^{2}+1)({\sqrt {x}}-2)+(x+1)(2x)({\sqrt {x}}-2)+(x+1)(x^{2}+1)\left({\frac {1}{2{\sqrt {x}}}}\right).}](https://wikimedia.org/api/rest_v1/media/math/render/svg/309f6a1a5457e224fcb60b87b6ec4c893cd6d270)
La règle du produit peut aussi être généralisée en la règle de Leibniz pour la dérivation d'ordre supérieur d'un produit de deux fonctions d'une variable réelle[2].
Soient
un entier supérieur ou égal à 1, et
et
deux fonctions
fois dérivables en un certain point
, alors leur produit
est aussi
fois dérivable au point
, et la dérivée d'ordre
est donnée par :

où les nombres entiers
sont les coefficients binomiaux, et où l'on convient que la « dérivée zéro-ième » de
, notée
, est la fonction
elle-même.
Cette formule se démontre par récurrence sur
[3]. La démonstration est comparable à celle de la formule du binôme de Newton.
On peut aussi démontrer la formule de Leibniz en utilisant un développement de Taylor-Young.
La formule suivante généralise simultanément les deux précédentes :
,
où les entiers

sont les coefficients multinomiaux. La preuve peut se faire par récurrence sur m, le nombre de fonctions considérées, en utilisant la formule (qui se réduit à la formule de Leibniz) au rang m=2.
La règle du produit s'étend à des fonctions de plusieurs variables réelles (définies sur ℝn) ou plus généralement, des fonctions dont la variable est un vecteur :
Soient E un espace vectoriel normé et f, g : E → ℝ deux fonctions différentiables en un point x de E. Alors, le produit f g est différentiable en x et sa différentielle en ce point est la forme linéaire continue

On dispose de résultats analogues pour les dérivées directionnelles et les dérivées partielles.
Par le même calcul que ci-dessus mais en remplaçant la variable réelle par une variable complexe, on démontre la règle suivante pour un produit de fonctions holomorphes.
Soient U un ouvert de ℂ et f, g : U → ℂ des fonctions holomorphes. Alors, le produit f g est holomorphe et :

On peut aussi le déduire de la sous-section précédente (pour E = ℂ) et des équations de Cauchy-Riemann.
Si l'on regarde de près la démonstration de la règle du produit, on se rend compte que l'ingrédient principal, outre la dérivabilité des fonctions, est la distributivité de la multiplication par rapport à l'addition (le fait que a(b + c) = ab + ac). Or les mathématiciens ont pris l'habitude de n'appeler produit que les opérations bénéficiant de cette propriété. Par contre tous les produits ne sont pas commutatifs (ab = ba quand a et b sont des nombres, mais ce n'est pas vrai pour d'autres produits). On peut donc en toute confiance appliquer la règle du produit à d'autres produits d'autres fonctions que la multiplication de fonctions numériques, mais en prenant garde de bien conserver l'ordre des facteurs quand le produit n'est pas commutatif.
Produit matriciel :
Soient A(t) et B(t) deux matrices fonctions du temps t (et dérivables) et de dimensions telles que le produit AB existe. Alors :
![{\displaystyle {\frac {\mathrm {d} }{\mathrm {d} t}}[A(t)B(t)]={\frac {\mathrm {d} A}{\mathrm {d} t}}B+A{\frac {\mathrm {d} B}{\mathrm {d} t}},}](https://wikimedia.org/api/rest_v1/media/math/render/svg/7255372c3fddf600cb044759452288d0bb57e99b)
et de même en remplaçant partout le produit matriciel ordinaire par le produit de Hadamard ou celui de Kronecker.
De même que dans le § « Dimensions supérieures », on peut, dans tous ces exemples, remplacer la variable réelle (« temps ») par une variable vectorielle.
Soient X, Y et Z des espaces vectoriels normés, et B : X×Y → Z une application bilinéaire continue. Alors, B est différentiable et sa différentielle en un point (x, y) de X×Y est l'application linéaire continue :

Par composition avec un couple de fonctions (u, v) : T → X×Y définies sur un espace vectoriel normé T, on en déduit la forme générique des exemples ci-dessus :
Si u et v sont différentiables en un point t0 de T alors la composée

l'est aussi, et sa différentielle en ce point est :
