Парсинг сайта единой информационной системы в сфере закупок (Госзакупки - zakupki.gov.ru)

Опубликовал Евгений (le_) в раздел Обработки

Обработка предназначена для поиска [по заданным параметрам] информации в единой государственной информационной системе в сфере закупок и вывода её в табличный документ.

Параметры поиска, которые можно использовать в обработке, показаны на первом скриншоте.

Результат работы обработки отображается в виде таблицы (третий скриншот).

Таблицу можно сохранить в Excel и далее производить с этими данные нужные манипуляции (накладывать фильтры, сортировать и т.п.).

Запросы отправляются на сервер с интервалом 0.5 сек. При обработке большого количества найденных заказов/лотов, сервер может заблокировать клиентский IP на 15 минут. Это время обработка будет ожидать возможности продолжить работу с сервером.

Цикл обработки большого количества найденных заказов можно прервать сочетанием клавиш Ctrl + Break, при этом, данные, которые уже были обработаны, отобразятся в таблице.

Если найденных заказов несколько тысяч, сервер отображает их количество округленным до 1000, в связи с этим, невозможно определить точное число страниц, которые нужно обработать. Как следствие, число страниц с заказами, которые будут обработаны, может быть значительно меньше числа страниц с найденными заказами (на странице 50 заказов). Не рекомендую использовать обработку для поиска с параметрами, которым соответствует большое количество заказов (в т.ч., по причине создания большой нагрузки на сервер госзакупок).

В обработке используются com-объект WScript.Shell и программа WScript.exe. При открытии обработки у некоторых пользователеё может выдаваться предупреждение системы контроля учетных записей Windows. После разрешения обработке выполнения требуемых действий, возможно, обработку нужно будет перезапустить.

Стоит заметить, что у сервиса госзакупок существует FTP сервер, в публичном каталоге которого, выкладываются данные по всем закупкам, но там присутствуют данные только за пред. день и более ранние. Т.е., это что-то типа бэкапов. Данные там лежат в виде архивов с xml внутри и их легко можно распарсить, но тому, кто просил такую обработку, этот вариант не подошел, ввиду того, что там нет актуальных данных за текущий день.

Скачать файлы

Наименование Файл Версия Размер
Обработка для парсинга сайта госзакупок
.epf 17,11Kb
16.03.17
3
.epf 1.0.0.0 17,11Kb 3 Скачать

См. также

В этой теме еще нет сообщений.
Оставьте свое сообщение