Решил попрактиковаться в парсинге сайтов на примере сайта auto.ru.
Необходимо задать сформированную ссылку, например, по нужным моделям автомобилей, за сегодняшний день.
Далее переходим к просмотру сайта.
Сделал парсинг двумя видами:
- первый способ, обход непосредственно поля HTML.
- второй способ, через построитель DOM.
Обработка может обходить многостраничные результаты выдачи сайта.
Также умеет заходить в объявления, и забирать из них крупную картинку.
Обработка, по сути, является наработкой, на примере которой можно создавать свои собственные парсеры сайтов.