gifts2017

Парсинг web-страницы для поиска mp3-файлов

Опубликовал Кирилл Евсеев (Капитан.Кук) в раздел Обработки - Универсальные обработки

Обработка ищет в исходном коде страницы сайта ссылки на Mp3-файлы и загружает их в выбранную папку.

Если открыть исходный код некоторых сайтов, то можно обнаружить, что они содержат ссылки на mp3-файлы, следующего вида: http://адрессайта/медиа/1.mp3.

Для парсинга таких ссылок используется регулярное выражение:

 RegExp.Pattern = "([^\s\t\n\r\\:\|\*<>]+)(\.mp3)".

Обработка выбирает все ссылки из текстового файла (HTML-кода) и загружает их в выбранную папку.

 

Инструкция по использованию:

1. Заходите на нужный Вам сайт и открываете его исходный код. Для этого обычно хватает нажать правую клавишу мыши на странице сайта и выбрать из появившегося меню пункт "Просмотр кода страницы" или т.п.

Если не получается, прочтите об этом здесь.

2. Проверьте, есть ли в коде страницы ссылки нужного формата.

Нажмите Ctrl+F, в появившемся окне введите ".mp3", браузер покажет количество ссылок с таким расширением.

Ссылки формата /медиа/1.mp3 обработка загрузить не сможет.

3. Выделите весь код страницы (Ctrl+A) и скопируйте его в буфер (Ctrl+С).

4. Создайте новый текстовый файл и вставьте туда код страницы (Ctrl+V).

5. Выберете полученный файл в обработке, а также укажите папку, куда сохранять файлы.

6. Нажмите "Выполнить".

Скачать файлы

Наименование Файл Версия Размер Кол. Скачив.
Парсинг Mp3-файлов для 8.2
.epf 7,76Kb
02.10.15
1
.epf 1.0 7,76Kb 1 Скачать
Парсинг Mp3-файлов для 8.3
.epf 8,03Kb
02.10.15
2
.epf 1.0 8,03Kb 2 Скачать

См. также

PowerTools от 1 000
Подписаться Добавить вознаграждение

Комментарии

1. Александр Лопатин (lopatin) 10.11.15 15:27
А если сделать загрузку веб-страницы непосредственно в окне обработки? Ввел URL, страница погрузилась и дальше работать с тем, что получилось в окне.
2. Кирилл Евсеев (Капитан.Кук) 10.11.15 16:07
(1) lopatin, на некоторых сайтах нужно вводить пароль и логин, чтобы отобразился список mp3-файлов.
Работа обработки специально была реализована через текстовый файл, чтобы исключить процесс авторизации.
3. Александр Крынецкий (echo77) 10.11.15 20:12
Корректнее назвать публикацию "Парсинг web-страницы для поиска mp3-файлов"
mp3-файла, как я понял, вы не парсите
4. Кирилл Евсеев (Капитан.Кук) 10.11.15 21:55
(3) echo77, Вы правы. Поправил. Спасибо.
Для написания сообщения необходимо авторизоваться
Прикрепить файл
Дополнительные параметры ответа