Common Voice
From Wikipedia, the free encyclopedia
| Common Voice | ||
Aperçu de la page d’accueil de Common Voice en avril 2021 | ||
| Adresse | https://commonvoice.mozilla.org/fr | |
|---|---|---|
| Description | Projet de myriadisation d'une base de données vocales libre, destinée aux concepteurs d'outils de traitement automatique des langues | |
| Commercial | ||
| Licence | CC0 | |
| Publicité | ||
| Type de site | Plateforme d'enregistrement et de réécoute de phrases, de présentation du projet et de téléchargement des jeux de données | |
| Langue | Multilingue (liste des langues) | |
| Inscription | ||
| Propriétaire | Mozilla Foundation | |
| Créé par | Mozilla Foundation et la communauté Mozilla | |
| Lancement | 19 juin 2017 | |
| État actuel | ||
| modifier |
||
Common Voice est un projet de myriadisation initié par Mozilla dans le but de produire une base de données libre pour la reconnaissance automatique de la parole. Il est soutenu par des volontaires qui enregistrent des phrases avec un microphone et vérifient les enregistrements d'autres utilisateurs. Les audios et leur transcription sont ensuite réunis dans une base de données du domaine public, sous la licence CC0. Cette licence permet aux développeurs d'utiliser la base de données vocales pour leurs applications de reconnaissance vocale (en anglais Speech-to-text, STT) sans coûts ni restrictions.
L'objectif de Common Voice est de récolter des échantillons de voix variés. Selon Katharina Borchert, responsable en chef de l'innovation chez Mozilla, de nombreux projets de reconnaissance vocale existants ont récupéré leurs données depuis des radios publiques, et les jeux de données traditionnels ont tendance à sous-représenter les femmes ainsi que les personnes ayant un accent minoritaire[1],[2].