Archive.today

site web d'archivage From Wikipedia, the free encyclopedia

Archive.today, anciennement archive.is, est un site web d'archivage des pages du web. Il fonctionne en utilisant Apache Hadoop et Apache Accumulo.

Faits en bref Adresse, Publicité ...
Logo de Archive.today

Image illustrative de l’article Archive.today

Adresse Site officiel
Publicité non
Type de site Archivage web
Langue français
Inscription non
Lancement 2012
État actuel actif
Fermer

Créateur

Parce que le site ne donne aucune indication sur son créateur ou sur son modèle économique[1], certaines personnes dont le blogueur Jani Patokallio se sont mises à la recherche de son créateur qui pourrait être un certain Denis Petrov[2] basé à New-York.

En novembre 2025, le site fait l'objet d'une enquête du Federal Bureau of Investigation pour identifier ses exploitants[3].

Particularité

La particularité du site est de capturer à la demande les pages web page par page afin de ne pas être affecté par l'éventuelle présence d'un fichier robots.txt[4]. Il est par conséquent impossible d'interdire l'archivage de tout site, ce qui explique les critiques fréquentes à son encontre.

Retrait des liens de Wikipédia

Début 2026, une consultation menée sur la version anglophone de Wikipédia[5] a abouti à un consensus appelant à l'inscription d'archive.today sur liste noire. Les contributeurs wikipedia procèdent à la suppression d'environ 695 000 liens vers le site pour les substituer par les sources originales ou par des archives fiables, comme Wayback Machine d'Internet Archive[6].

Cette décision est la conséquence de plusieurs comportements problématiques du gestionnaire du site ; ce dernier avait inséré du code dans son captcha pour que le visiteur d'archive.today participe à une attaque par déni de service contre le blog de Jani Patokallio, un journaliste qui tentait de l'identifier[7],[8],[9].

Références

Voir aussi

Related Articles

Wikiwand AI