Vous connaissez sûrement le célèbre site Wayback Machine, permettant de remonter dans les « archives d’Internet » et de retrouver les anciennes versions de sites web. Il se peut que pour une raison ou une autre vous ayez besoin de télécharger une archive entière d’un site, et c’est ce que permet le script WaybackPack !
Wayback Machine pour remonter dans le temps
Revoir des versions anciennes de sites web fait parfois sourire, notamment quand il s’agit de gros sites ! Un design très année 2000, de gros tableaux HTML avec de jolis GIF… ça faisait rêver !
Exemple ici avec le célèbre jeuxvideo.com en… 1998 ! Sympa non ?
Le script waybackpack
Il s’agit donc d’un outil en ligne de commande permettant de télécharger la version d’un site tout entier à partir du site Wayback Machine. Il nécessite juste d’avoir python d’installé sur sa machine Linux !
Installation :
pip install waybackpack
Création d’un répertoire pour stocker le site
mkdir ~/Dossier/NomDuRepertoire
Télécharger toutes les pages disponibles jusqu’en 1997
waybackpack monsite.com -d ~/Dossier/NomDuRepertoire --end 1997
Waybackpack possède également d’autres commandes à utiliser selon vos besoins !
Si le projet vous intéresse, sachez qu’il est disponible sur GitHub