Пример парсинга web-страницы, поиск ссылки на картинку из страницы по атрибуту

04.08.15

–

На примере сайта brain.com.ua покажу, как можно получить ссылку на картинку из веб-страницы.

Скачать исходный код

	Наименование	Файл	Версия	Размер
	СсылкаНаФотоПоАтрибуту.epf .epf 7,00Kb 9	.epf		7,00Kb	9	Скачать

Поступило задание на парсинг страницы сайта. Например, нам нужна ссылка на основное фото. Для начала, узнаем имя этого атрибута. Если вы используете браузер Мозилла (в других, по-другому), достаточно в открытой странице на элементе вызвать контекстное меню и выбрать пункт Inspect element:

После этого в появившимся окне спотрим, как называется текущий атрибут. В нашем случае, "large_picture_container":

Дальше пишем простенький код на примере нашего сайта:

Функция Парсинг(Ссылка)
	
	ЧтениеHTML = Новый ЧтениеHTML;
    ЧтениеHTML.ОткрытьФайл(Ссылка);
     
    ПостроительDOM = Новый ПостроительDOM;
    ДокументHTML = ПостроительDOM.Прочитать(ЧтениеHTML);
    
    ЭлементыDOM = ДокументHTML.ПолучитьЭлементыПоИмени("span");
	
	СсылкаВрем = "";
	Для Каждого ЭлементDOM Из ЭлементыDOM Цикл
		Если ЭлементDOM.ИмяКласса = "large_picture_container" Тогда
			Для каждого ДочУзл Из ЭлементDOM.ДочерниеУзлы Цикл
				Если ДочУзл.ИмяУзла = "img" Тогда
					СсылкаВрем = ДочУзл.Источник;
					Возврат (ЗначениеЗаполнено(СсылкаВрем), "http://brain.com.ua" + СсылкаВрем ,"");
				КонецЕсли;	
			КонецЦикла;
			СсылкаВрем = ЭлементDOM		
		КонецЕсли;
	КонецЦикла;
	
	Возврат "";
	
КонецФункции

Парсинг веб-страница картинка по атрибуту

–

См. также

Интеграция Альфа Авто 5 / Альфа Авто 6 и AUTOCRM / Инфотек

Сайты и интернет-магазины WEB-интеграция Платформа 1С v8.3 Конфигурации 1cv8 1С:Управление торговлей 11 Автомобили, автосервисы Россия Управленческий учет Платные (руб)

Интеграционный модуль обмена между конфигурацией Альфа Авто 5 и Альфа Авто 6 и порталом AUTOCRM. Данный модуль универсален. Позволяет работать с несколькими обменами AUTOCRM разных брендов в одной информационной базе в ручном и автоматическом режиме.

36000 руб.

03.08.2020 15936 13 18

Управление доставками Boxberry, СДЭК, ЭкстраПочта, Почта России, Энергия, DPD, ПЭК, Grastin, Деловые Линии, КСЕ, Dalli

WEB-интеграция Рабочее место Оптовая торговля Розничная торговля Логистика, склад и ТМЦ Платформа 1С v8.3 1С:Бухгалтерия 2.0 1С:Управление торговлей 10 1С:Розница 2 1С:Управление нашей фирмой 1.6 1С:Бухгалтерия 3.0 1С:Управление торговлей 11 1С:Комплексная автоматизация 2.х Оптовая торговля, дистрибуция, логистика Россия Управленческий учет Платные (руб)

Управление доставками в транспортных компаниях из 1С.

18000 руб.

10.03.2016 56767 289 97

Все службы доставки в Вашей 1С! Без изменения конфигурации! УТ, ERP, КА, УНФ

WEB-интеграция Рабочее место Оптовая торговля Розничная торговля Логистика, склад и ТМЦ Платформа 1С v8.3 1С:ERP Управление предприятием 2 1С:Управление торговлей 11 Россия Управленческий учет Платные (руб)

40+ служб доставки для 1С в одном модуле! Внешняя обработка, которая НЕ изменяет Вашу конфигурацию! Подписная модель на 1 год.

19200 руб.

22.03.2017 36462 16 47

Интеграция с OpenCart 2.x, 3x

WEB-интеграция Оптовая торговля Розничная торговля Управляемые формы 1С:Розница 2 1С:Управление нашей фирмой 1.6 1С:Бухгалтерия 3.0 1С:Управление торговлей 11 Розничная и сетевая торговля (FMCG) Оптовая торговля, дистрибуция, логистика Управленческий учет Платные (руб)

Внешняя обработка, позволяет обмениваться данными между OpenCart (самая популярная бесплатная cms для интернет-магазинов) и 1С:Предприятие 8.

6800 руб.

17.11.2015 115934 344 137

213

Заполнение по ИНН или наименованию реквизитов контрагента по данным сайта ФНС

Обмен с ГосИС WEB-интеграция Платформа 1С v8.3 Управляемые формы 1С:Комплексная автоматизация 1.х 1С:Бухгалтерия 2.0 1С:Управление торговлей 10 1С:Управление производственным предприятием 1С:Управление нашей фирмой 1.6 1С:Бухгалтерия государственного учреждения 1С:Документооборот 1С:ERP Управление предприятием 2 1С:Бухгалтерия 3.0 1С:Управление торговлей 11 1С:Комплексная автоматизация 2.х Платные (руб)

Обработка является альтернативой механизму, разработанному фирмой 1С и заполняющему реквизиты контрагента по ИНН или наименованию. Не требуется действующей подписки ИТС. Вызывается как внешняя дополнительная обработка, т.е. используется, непосредственно, из карточки контрагента. Заполнение по ИНН или наименованию реквизитов контрагента по данным сайта ФНС (egrul.nalog.ru) для БП 2.0, БП 3.0, БГУ 1.0, БГУ 2.0, УТ 10.3, УТ 11.x, КА 1.1, КА 2.x, УПП 1.x, ERP 2.x, УНФ 1.5, УНФ 1.6, УНФ 3.0, ДО 2.1

2400 руб.

28.04.2016 88971 163 216

318

[Расширение] БОР-Навигатор.Культура

Зарплата Бюджетный учет WEB-интеграция Обмен с ГосИС Платформа 1С v8.3 Сложные периодические расчеты 1С:Зарплата и кадры государственного учреждения 3 Государственные, бюджетные структуры Россия Бюджетный учет Платные (руб)

Расширение конфигурации, включающее в себя объекты, необходимые для подготовки и сдачи отчета "Штатная численность" системы "БОР-Навигатор.Культура" в программе "1С:Зарплата и кадры государственного учреждения", редакция 3.1.

8400 руб.

01.02.2019 25875 9 0

Интеграция с сервисом vetmanager

WEB-интеграция Платформа 1С v8.3 Бухгалтерский учет 1С:Бухгалтерия 3.0 Бытовые услуги, сервис Платные (руб)

Внешняя обработка разрабатывалась для загрузки документов из Ветменеджер в 1С: Бухгалтерия 3.0

12000 руб.

02.02.2021 16481 42 49

Merlion Commander Версия 1.3.9.2 - июль 2022 г. (Интеграция с 1С: УT, редакция 11.4, 1С:Розница 2.3,1С:ERP Управление предприятием 2, УТ 10.3, редакция веб-сервиса MERLION API 3.0 от 18.08.2021)

Оптовая торговля Розничная торговля WEB-интеграция Платформа 1С v8.3 1С:Управление торговлей 11 Россия Платные (руб)

Расширении конфигурации "Управление торговлей, редакция 11" для работы с веб-сервисом Мерлион с помощью Merlion API. Расширение и набор подключаемых дополнительных обработок позволяет без изменения конфигурации получить возможность работы с API крупнейшего российского дистрибьютора http://merlion.com. Логика работы максимально приближена к работе веб-сервиса b2b. Вы сможете создать и исправить заказ, зарезервировать товар прямо из 1С, посмотреть актуальные остатки и цены, импортировать штрихкода EAN13 товаров, загружать заказ c автоматическим созданием номенклатуры в 1С и корректности создания. Можно выбирать характеристики по товарным группам и загружать товар с выбранными характеристиками, загружать изображения товара. Не требуется установки дополнительного ПО для работы с веб-сервисом. Кроссплатформенное решение для ОС Windows и Linux. Весь код модулей открыт и доступен для просмотра и внесения изменений.

8280 руб.

02.05.2017 41026 43 64

Комментарии

Подписаться на ответы Инфостарт бот

Свернуть все

1. Yashazz 4723 04.08.15 13:55 Сейчас в теме

Верно. Подобное действие является одним из множества кирпичиков, составляющих парсинг сайта. Только не очень понятно, зачем ради этого отдельную статью делать)
Ну и советую при не очень богатом разнообразии имён тегов использовать XPath, чтоб не промахнуться.

2. cool.vlad4 2 04.08.15 15:13 Сейчас в теме

(1) Yashazz, а я как в 1С делать xpath запросы к html , который с точки зрения xml может быть невалидным? (достроив до валидного, но есть ли готовый код?)
(0) в xpath это будет //img[@class='large_picture_container']/@src (можно еще не "=" а contain использовать , а если есть верояность , что тэг не всегда img , то вместо img : //*[@class='large_picture_container']/@src )

4. Yashazz 4723 06.08.15 13:16 Сейчас в теме

(2) cool.vlad4, знаешь, я внаглую нормализую узлы DOM, загоняю их копированием разными способами в xml и парсю, вроде прокатывает. Ни разу на невалидность не попадал, хотя, может, мало экспериментировал. Посмотри методы, работающие со всяким пересовыванием узлов туда-сюда.

3. MsDjuice 114 05.08.15 10:30 Сейчас в теме

(1) Yashazz, Отдельная статья для таких как я. Дали задания и не знаешь с чего начать. А начать хотя бы с этого.

5. alex_4x 85 07.07.17 14:23 Сейчас в теме

Добрый день! Вижу вы занимаетесь скрещиванием ужей с ежами, а мне это тоже нужно.
Вопрос немного не про картинки. Задача такая - из 1С нужно получить все открытые в IE, Опере, Firefox'е, Хроме - странички. Для начала просто получить список страниц (их URL-ы). Не подскажите как это сделать? Спасибо!
Можно на примере хотя бы одного любого браузера, так как возможно для каждого браузера это будут разные механизмы.
Спасибо!