Парсинг web-страницы для поиска mp3-файлов

Опубликовал Кирилл Евсеев (Капитан.Кук) в раздел Обработки - Универсальные обработки

Обработка ищет в исходном коде страницы сайта ссылки на Mp3-файлы и загружает их в выбранную папку.

Если открыть исходный код некоторых сайтов, то можно обнаружить, что они содержат ссылки на mp3-файлы, следующего вида: http://адрессайта/медиа/1.mp3.

Для парсинга таких ссылок используется регулярное выражение:

 RegExp.Pattern = "([^\s\t\n\r\\:\|\*<>]+)(\.mp3)".

Обработка выбирает все ссылки из текстового файла (HTML-кода) и загружает их в выбранную папку.

 

Инструкция по использованию:

1. Заходите на нужный Вам сайт и открываете его исходный код. Для этого обычно хватает нажать правую клавишу мыши на странице сайта и выбрать из появившегося меню пункт "Просмотр кода страницы" или т.п.

Если не получается, прочтите об этом здесь.

2. Проверьте, есть ли в коде страницы ссылки нужного формата.

Нажмите Ctrl+F, в появившемся окне введите ".mp3", браузер покажет количество ссылок с таким расширением.

Ссылки формата /медиа/1.mp3 обработка загрузить не сможет.

3. Выделите весь код страницы (Ctrl+A) и скопируйте его в буфер (Ctrl+С).

4. Создайте новый текстовый файл и вставьте туда код страницы (Ctrl+V).

5. Выберете полученный файл в обработке, а также укажите папку, куда сохранять файлы.

6. Нажмите "Выполнить".

Скачать файлы

Наименование Файл Версия Размер
Парсинг Mp3-файлов для 8.2
.epf 7,76Kb
02.10.15
1
.epf 1.0 7,76Kb 1 Скачать
Парсинг Mp3-файлов для 8.3
.epf 8,03Kb
02.10.15
2
.epf 1.0 8,03Kb 2 Скачать

См. также

Добавить вознаграждение
Комментарии
1. Александр Лопатин (lopatin) 206 10.11.15 15:27 Сейчас в теме
А если сделать загрузку веб-страницы непосредственно в окне обработки? Ввел URL, страница погрузилась и дальше работать с тем, что получилось в окне.
2. Кирилл Евсеев (Капитан.Кук) 7 10.11.15 16:07 Сейчас в теме
(1) lopatin, на некоторых сайтах нужно вводить пароль и логин, чтобы отобразился список mp3-файлов.
Работа обработки специально была реализована через текстовый файл, чтобы исключить процесс авторизации.
3. Александр Крынецкий (echo77) 666 10.11.15 20:12 Сейчас в теме
Корректнее назвать публикацию "Парсинг web-страницы для поиска mp3-файлов"
mp3-файла, как я понял, вы не парсите
4. Кирилл Евсеев (Капитан.Кук) 7 10.11.15 21:55 Сейчас в теме
(3) echo77, Вы правы. Поправил. Спасибо.