Archive.today
site web d'archivage
From Wikipedia, the free encyclopedia
Archive.today, anciennement archive.is, est un site web d'archivage des pages du web. Il fonctionne en utilisant Apache Hadoop et Apache Accumulo.
| Adresse | Site officiel | |
|---|---|---|
| Publicité | non | |
| Type de site | Archivage web | |
| Langue | français | |
| Inscription | non | |
| Lancement | 2012 | |
| État actuel | actif | |
| modifier |
||
Créateur
Parce que le site ne donne aucune indication sur son créateur ou sur son modèle économique[1], certaines personnes dont le blogueur Jani Patokallio se sont mises à la recherche de son créateur qui pourrait être un certain Denis Petrov[2] basé à New-York.
En novembre 2025, le site fait l'objet d'une enquête du Federal Bureau of Investigation pour identifier ses exploitants[3].
Particularité
La particularité du site est de capturer à la demande les pages web page par page afin de ne pas être affecté par l'éventuelle présence d'un fichier robots.txt[4]. Il est par conséquent impossible d'interdire l'archivage de tout site, ce qui explique les critiques fréquentes à son encontre.
Retrait des liens de Wikipédia
Début 2026, une consultation menée sur la version anglophone de Wikipédia[5] a abouti à un consensus appelant à l'inscription d'archive.today sur liste noire. Les contributeurs wikipedia procèdent à la suppression d'environ 695 000 liens vers le site pour les substituer par les sources originales ou par des archives fiables, comme Wayback Machine d'Internet Archive[6].
Cette décision est la conséquence de plusieurs comportements problématiques du gestionnaire du site ; ce dernier avait inséré du code dans son captcha pour que le visiteur d'archive.today participe à une attaque par déni de service contre le blog de Jani Patokallio, un journaliste qui tentait de l'identifier[7],[8],[9].