Comparaison de fichiers

From Wikipedia, the free encyclopedia

Example d'interface de comparaison de fichiers.

En informatique, la comparaison de fichiers consiste à comparer leur contenu, en isolant leurs différences de leur contenu commun. Le résultat de la comparaison peut être affiché en environnement graphique GUI, en mode texte, ou comme partie de tâches plus larges en réseau, dans un système de fichiers ou un système de gestion de versions.

Les programmes de comparaison de fichiers les plus largement utilisés sont diff, cmp (Unix) (en) ou WinMerge.

De nombreux éditeurs de texte[1] et logiciels de traitement de texte[2] utilisent la comparaison de fichiers pour mettre en évidence les modifications apportées à un document.

La plupart des outils de comparaison de fichiers utilisent la plus longue sous-séquence commune entre deux fichiers pour la supprimer ou l'insérer selon le besoin de présentation.

Un algorithme de comparaison spécifique est par ailleurs breveté[3].

Le protocole de mise à jour à distance rsync utilise la fonction de hachage Rolling hash (en) pour comparer deux fichiers sur deux ordinateurs distants.

Par ailleurs, la comparaison de fichiers pour le traitement de texte se limite généralement au niveau des mots alors que des algorithmes au niveau de la ligne sont généralement utilisés pour la plupart des outils de programmation.

Enfin, certaines applications peuvent la situer au niveau du Byte ou d'un caractère[4].

Logique sous-jacente

La comparaison de fichiers est utilisée pour de multiples raisons. Pour la comparaison de fichiers binaires, la comparaison au niveau byte est certainement la meilleure. Mais pour la comparaison de fichiers texte, une comparaison visuelle étape par étape est généralement utilisée[5]. Cela confère à l'utilisateur la possibilité de décider quel fichier privilégier ; s'il faut par exemple fusionner le contenu de plusieurs fichiers pour refléter la somme des différences ou contributions ; ou également s'il faut les conserver tels quels pour y revenir ultérieurement; ces mécanismes apparaissent comme une forme de contrôle des versions[6] Ce contrôle des versions est également important à des fins de sauvegarde.

La comparaison de fichiers est aussi importante, et probablement partie intégrante de la synchronisation de fichiers et/ou de la sauvegarde. La corruption des données est un point crucial des méthodes de sauvegarde. Ce problème peut théoriquement intervenir sans avertissement ou sans que l'utilisateur en ait conscience. C'est pourquoi les outils de sauvegarde intègrent la plupart du temps des mécanismes de comparaison de fichiers[7].

Historique

Notes et références

Articles connexes

Related Articles

Wikiwand AI