Il y a de belles images sur Tumblr. Nous pouvons utiliser les API Tumblr pour rechercher et télécharger des images, mais cela nécessite généralement l’enregistrement et les clés API. Une autre façon consiste à explorer les pages Web HTML et à analyser le DOM (Document Object Model), ce qui nous permet de récupérer les URL des images et leurs descriptions.
Il existe une bibliothèque pratique qui s’appelle PHPQuery. Cela nous permet d’écrire du PHP de style JQuery de la même manière que nous écrivons JQuery, en utilisant des sélecteurs CSS. Cela rend le PHP puissant pour analyser le DOM de toutes les pages HTML.
requête php
Ce qui suit est un pseudo-code qui illustre comment analyser les pages HTML et saisir les images.
Avec PHPQuery, il devient tellement plus simple d’analyser le DOM ! Cliquez pour tweeter
Avec peu de modifications, vous pouvez laisser le script explorer plusieurs milliers d’images en quelques minutes. Toutes les images sont enregistrées dans des bases de données locales sur le serveur VPS. Les images peuvent être vues sur: uploadbeta.com
Il est préférable de définir un intervalle de temps entre les explorations de pages, sinon l’ adresse IP risque d’être bloquée.
Exploration d’images
PS, le site Web de téléchargement d’images prend en charge quelques API à diverses fins soumises à la politique d’utilisation équitable : https://uploadbeta.com/picture-gallery/faq.php#api