Na Tumblrze jest kilka fajnych obrazków. Możemy używać interfejsów API Tumblr do wyszukiwania i pobierania obrazów, jednak zwykle wymaga to rejestracji i kluczy API. Innym sposobem jest indeksowanie stron internetowych HTML i parsowanie DOM (Document Object Model), który pozwala nam pobrać adresy URL obrazów i ich opisy.
Istnieje przydatna biblioteka o nazwie PHPQuery. Pozwala nam pisać PHP w stylu JQuery w taki sam sposób, w jaki piszemy JQuery, przy użyciu selektorów CSS. To sprawia, że PHP jest potężnym narzędziem do analizy DOM dowolnych stron HTML.
phpquery
Poniżej znajduje się pseudokod, który ilustruje, jak analizować strony HTML i pobierać obrazy.
Dzięki PHPQuery analiza DOM staje się o wiele łatwiejsza! Kliknij, aby tweetować
Przy niewielkich modyfikacjach możesz pozwolić skryptowi przeszukiwać kilka tysięcy zdjęć w ciągu kilku minut. Wszystkie obrazy są zapisywane w lokalnych bazach danych na serwerze VPS. Zdjęcia można zobaczyć na: uploadbeta.com
Lepiej ustawić odstęp czasu między indeksowaniem strony, w przeciwnym razie adres IP może zostać zablokowany.
Indeksowanie obrazu
PS, witryna Image Upload obsługuje kilka interfejsów API do różnych celów podlegających polityce dozwolonego użytku: https://uploadbeta.com/picture-gallery/faq.php#api