Tem algumas imagens legais no Tumblr. Podemos usar as APIs do Tumblr para pesquisar e baixar imagens, mas isso geralmente requer o registro e as chaves de API. Outra maneira é rastrear as páginas da Web em HTML e analisar o DOM (Document Object Model), o que nos permite recuperar as URLs das imagens e suas descrições.
Existe uma biblioteca útil que é chamada PHPQuery. Ele nos permite escrever PHP no estilo JQuery da maneira que escrevemos JQuery, usando seletores CSS. Isso torna o PHP poderoso na análise do DOM de qualquer página HTML.
consulta php
A seguir está um pseudocódigo que ilustra como analisar as páginas HTML e capturar as imagens.
Com PHPQuery, fica muito mais fácil analisar o DOM! Clique para Tweetar
Com poucas modificações, você pode deixar o script rastrear vários milhares de imagens em poucos minutos. Todas as imagens são salvas em bancos de dados locais no servidor VPS. As fotos podem ser vistas em: uploadbeta.com
É melhor definir um intervalo de tempo entre o rastreamento da página, caso contrário, o endereço IP poderá ser bloqueado.
Rastreamento de imagem
PS, o site Image Upload suporta algumas APIs para vários fins sujeitos à política de uso justo: https://uploadbeta.com/picture-gallery/faq.php#api