Быстрая обработка данных / обработка информации на стороне GPU

27.03.24

База данных - HighLoad оптимизация

Вам надоело сидеть и ждать, пока произойдёт пересчет данных? Хотите ускорить этот процесс в разы? Хотите быстро посчитать сложные алгоритмы производства?  Планирование, себестоимость, нейросети и многие другие процессы можно перенести на "новые рельсы", оптимизировать процессы расчета информации с высокой скоростью. Этот механизм можно использовать в разных сферах, везде, где есть большие массивы данных.

Скачать файл

ВНИМАНИЕ: Файлы из Базы знаний - это исходный код разработки. Это примеры решения задач, шаблоны, заготовки, "строительные материалы" для учетной системы. Файлы ориентированы на специалистов 1С, которые могут разобраться в коде и оптимизировать программу для запуска в базе данных. Гарантии работоспособности нет. Возврата нет. Технической поддержки нет.

Наименование По подписке [?] Купить один файл
Быстрая обработка данных. Механизм максимально быстрой обработки информации от 1С на стороне GPU
.zip 199,81Mb
15
15 Скачать (1 SM) Купить за 1 850 руб.

Данное решение представляет вариант реализации расчета данных из 1С на стороне графической карты.

Общий принцип: На стороне 1С заполняем базу данных. ПО берёт данные на стороне базы данных и упаковывает их в буфер для чтения GPU. На стороне GPU используется специальный шейдер расчетов  (compute shader) который осуществляет обработку данных. После обработки, данные записываются обратно в БД.

Всё это позволяет говорить от обработке миллионов строк информации за кратчайшее время.

БД - это условная база данных, может быть реализована на SQL / Oracle / Postgresql  и т.д.
Реализация возможна на платформах Windows / Linux.

 

ЗНАКОМСТВО

Принцип работы системы основан на обработке данных в графических процессорах. GPU имеют сотни процессорных ядер общего назначения. Они намного проще, чем ядра в современном процессоре, но из-за того, что их так много, они могут выполнять параллельные вычисления на больших наборах данных очень быстро. Эти небольшие ядра сгруппированы в более крупные процессоры, которые совместно используют регистры, кэши, планировщик и т. д. и могут выполнять несколько пакетов работы в режиме hyper-threading.

 

БАЗОВЫЕ ПРИНЦИПЫ

Система построена с использованием библиотеки Vulkan. Данная технология используется уже более 10 лет, так что в современном оборудовании драйвера от Vulkan присутствуют по умолчанию. Compue shader - это механизм работы с графической картой. В отличие от более старых API, таких как OpenGL, поддержка вычислительных шейдеров в Vulkan обязательна. Это означает, что вы можете использовать вычислительные шейдеры в любой доступной реализации Vulkan, независимо от того, идет ли речь о высокопроизводительном настольном графическом процессоре или маломощном встраиваемом устройстве.

Это открывает мир вычислений общего назначения на графических процессорах (GPGPU) независимо от того, где выполняется ваше приложение. GPGPU означает, что вы можете выполнять общие вычисления на своем графическом процессоре, то, что традиционно было прерогативой центральных процессоров. Но поскольку графические процессоры становятся все более и более мощными и гибкими, многие рабочие нагрузки, требующие универсальных возможностей центрального процессора, теперь могут выполняться на графическом процессоре в режиме реального времени.

Вычислительные ресурсы можно использовать  для не визуальных вычислений, которые не требуют графического вывода, например, для обработки чисел или вещей, связанных с искусственным интеллектом. Это называется "headless compute".

 

ПРЕИМУЩЕСТВА

Выполнение ресурсоемких вычислений на графическом процессоре имеет несколько преимуществ. Самый очевидный из них — разгрузка работы с центрального процессора. Еще один способ не требует перемещения данных между оперативной памятью центрального процессора и памятью графического процессора. Все данные могут оставаться на графическом процессоре, не дожидаясь медленной передачи из основной памяти.

Кроме того, графические процессоры сильно распараллелены, а некоторые из них имеют десятки тысяч небольших вычислительных блоков. Это часто делает их более подходящими для рабочих процессов с высокой степенью параллелизма, чем ЦП с несколькими большими вычислительными блоками.

 

РЕАЛИЗАЦИЯ

Во вложении представлен пример реализации подобного механизма.

Данное решение реализовано на платформе Windows 10/11 x64. Используется внешняя БД: SQLite, что позволяет протестировать функционал без дополнительного оборудования. Также решение содержит библиотеки для использования на платформе Linux и является кроссплатформенным. 

На стороне 1С используется обработка на управляемых формах. Предполагается использование на платформе 1С:Предприятие 8.3. Конфигурация не важна. 

Тестировалось на: 1С:Предприятие 8.3 (8.3.13.1690)

 

Поле распаковки файла, мы должны установить ПО, которое находится в папке "sqliteodbc_w64.exe" - для COM соединения с БД SQLite. Также ПО можно скачать тут: http://www.ch-werner.de/sqliteodbc/

Также рекомендуется установить ПО для работы c SQLite https://sqlitebrowser.org/dl/

На этом настройка закончена. Приступаем к работе.

 

 

 

ПРИНЦИП РАБОТЫ

1. Запускаем 1С и выбираем файл обработки с расширением "epf"

2. Нажимаем на кнопку "Чтение видеокарт". Возможно, придётся нажать на неё несколько раз, т.к. 1С будет повторно запрашивать разрешения на запуск COM соединения и запуск bat файлов. 

После чего, в окошке справа появится список видеокарт, которые можно использовать для данной реализации.

Если на этом шаге возникнут проблемы, то ниже будут описаны варианты решения или возможного исправления ситуации.

3. Итак, после выбора видеокарты, мы нажимаем на кнопку "Запись начальных данных на SQLite". - Т.е. мы осуществляем первоначальное заполнение базы данных, данными для расчета.

4. "Жмём кнопку "Обработка данных на стороне GPU". - Система должна произвести расчет и выдать результат справа. Информация справа должна содержать в себе данные о времени чтения, обработки и перезаписи данных на стороне GPU.

5. Проверяем обработанные данные. Для этого служит кнопка "Прочитать данные из БД"

 

 

ВОЗМОЖНЫЕ ПРОБЛЕМЫ

Возможные причины, по которым ПО не будет работать: 

  1. Видеокарта не поддерживает compute shader
  2. Видеокарта не поддерживает Vulkan
  3. Драйвера видеокарты устарели 
  4. Платформа Windows устарела

Рекомендации по возможному исправлению ошибок следующие:

  1. Обновите драйвера видеокарты.
  2. Также могут помочь патчи для Windows начиная от: Visual C++ 2010.

Также важно помнить, что эксперименты с шейдерами могут повредить вашу видеокарту. По этому НЕ рекомендуется изменять шейдер программы.

 

Коллеги, буду рад критике, комментариям и пожеланиям. Также постараюсь помочь, если возникнут проблемы с ПО. 

1С: Быстрая обработка данных Механизм максимально быстрой обработки информации от 1С на стороне GPU Vulkan compute shader Vulkan + 1C 1C и GPU обработка данных 1С на видеокарте 1С и видеокартаб 1С и GPU CPU

См. также

HighLoad оптимизация Технологический журнал Системный администратор Программист Бесплатно (free)

Обсудим поиск и разбор причин длительных серверных вызовов CALL, SCALL.

24.06.2024    5802    ivanov660    12    

56

HighLoad оптимизация Программист Платформа 1С v8.3 Бесплатно (free)

Метод очень медленно работает, когда параметр приемник содержит намного меньше свойств, чем источник.

06.06.2024    10158    Evg-Lylyk    61    

45

HighLoad оптимизация Программист Платформа 1С v8.3 Конфигурации 1cv8 Бесплатно (free)

Анализ простого плана запроса. Оптимизация нагрузки на ЦП сервера СУБД используя типовые индексы.

13.03.2024    5525    spyke    28    

49

HighLoad оптимизация Программист Платформа 1С v8.3 Бесплатно (free)

Оказывается, в типовых конфигурациях 1С есть, что улучшить!

13.03.2024    8154    vasilev2015    20    

42

HighLoad оптимизация Инструменты администратора БД Системный администратор Программист Платформа 1С v8.3 Конфигурации 1cv8 Абонемент ($m)

Обработка для простого и удобного анализа настроек, нагрузки и проблем с SQL сервером с упором на использование оного для 1С. Анализ текущих запросов на sql, ожиданий, конвертация запроса в 1С и рекомендации, где может тормозить.

2 стартмани

15.02.2024    13193    266    ZAOSTG    87    

115

HighLoad оптимизация Системный администратор Программист Платформа 1С v8.3 Конфигурации 1cv8 Абонемент ($m)

Принимать, хранить и анализировать показания счетчиков (метрики) в базе 1С? Почему бы нет? Но это решение быстро привело к проблемам с производительностью при попытках построить какую-то более-менее сложную аналитику. Переход на PostgresSQL только временно решил проблему, т.к. количество записей уже исчислялось десятками миллионов и что-то сложное вычислить на таких объемах за разумное время становилось все сложнее. Кое-что уже практически невозможно. А что будет с производительностью через пару лет - представить страшно. Надо что-то предпринимать! В этой статье поделюсь своим первым опытом применения СУБД Clickhouse от Яндекс. Как работает, что может, как на нее планирую (если планирую) переходить, сравнение скорости работы, оценка производительности через пару лет, пример работы из 1С. Все это приправлено текстами запросов, кодом, алгоритмами выполненных действий и преподнесено вам для ознакомления в этой статье.

1 стартмани

24.01.2024    6252    glassman    20    

42

HighLoad оптимизация Программист Платформа 1С v8.3 Конфигурации 1cv8 Абонемент ($m)

Встал вопрос: как быстро удалить строки из ТЗ? Рассмотрел пять вариантов реализации этой задачи. Сравнил их друг с другом на разных объёмах данных с разным процентом удаляемых строк. Также сравнил с выгрузкой с отбором по структуре.

09.01.2024    16462    doom2good    49    

71
Комментарии
Подписаться на ответы Инфостарт бот Сортировка: Древо развёрнутое
Свернуть все
1. EvgeniyOlxovskiy 70 27.03.24 11:26 Сейчас в теме
Какой прирост производительности приносит это решение?
4. KHoroshulinAV 171 27.03.24 13:13 Сейчас в теме
(1)Ну я показал что на nvidea пересчет прошел за 0.003 секунды.
1С бы 100000 строк только в цикле перебирала бы минут 20
acces969; EvgeniyOlxovskiy; +2 1 Ответить
13. acces969 365 28.03.24 07:38 Сейчас в теме
(4) Ничего себе!
До чего дошел прогресс
18. JohnyDeath 302 29.03.24 16:56 Сейчас в теме
(4) а что именно происходит-то?
Я так понял все данные первоначально выгружаются в sqlite.
Тогда может стоит произвести замер с использованием самого движка sqlite без видеокарт?
К 1с его можно подрубить вот этой компонентой https://github.com/orefkov/v8sqlite
20. KHoroshulinAV 171 18.11.24 09:25 Сейчас в теме
Однозначно на стороне sqlie можно оперировать данными и это будет быстрее чем в 1С. Но на видеокарте быстрее на порядки.
2. Varies 27.03.24 12:36 Сейчас в теме
Вот если бы 1С сама умела вычислять на GPU, было бы круто.
Сейчас едва ли можно найти сервера с GPU.
3. KHoroshulinAV 171 27.03.24 13:12 Сейчас в теме
(2)Не вижу проблем поставить на сервере видеокарту.
21. KHoroshulinAV 171 18.11.24 09:26 Сейчас в теме
Ну у того же Яндекс облака уже имеются. И у других компаний подобных
5. s22 22 27.03.24 14:47 Сейчас в теме
6. kauksi 217 27.03.24 15:09 Сейчас в теме
ну вот есть выборка - 30000 записей в регистре сведений, которые нужно перезаписать, изменив допустим значения 2х ресурсов. всего в регистре несколько миллионов записей. В компе стоит RTX 4080
Как эта штука ускорит запись?
Еще лет 12 назад, когда только первые видяхи с CUDA появились, думал написать свою библиотеку - или внешнюю компоненту, чтобы ускорить какой то расчет в 1С. Например решение системы линейных уравнений при закрытии месяца в УПП. Но когда полез в код, стало ясно что там данные обрабатываются порциями в цикле, и накладные расходы времени при передаче/чтении куда то вовне гораздо больше чем ускорение расчета.
7. Somebody1 69 27.03.24 15:11 Сейчас в теме
(6) Тут вроде и не говорится об ускорении записи. Речь об ускорении расчётов.
8. kauksi 217 27.03.24 15:19 Сейчас в теме
(7) ну хорошо, не запись, расчет. Небольшой город/район мегаполиса, тыш на 200 жителей, 10000 квартир, льготники, площади, тарифы и т.д. разбить эту таблицу на 10000 строк, передать на каждое тензорное ядро чтобы оно выполнило арифметические операции и обратно получить результат... чтобы записать опять же в регистр...
ускорения особо не будет...
в медицине... может быть... в научных исследованиях да... в прикладных задачах 1С... вряд ли...
DmitryKSL; +1 Ответить
11. KHoroshulinAV 171 27.03.24 21:46 Сейчас в теме
(8)Согласен, штука специфичная, но всё же 1С разносторонняя программа.
22. KHoroshulinAV 171 18.11.24 09:29 Сейчас в теме
(8) Идея в том, чтобы 1н раз выгрузить все-все данные для обработки, потом их посчитать(часть можно на CPU а часть на GPU) и потом вернуть в 1С. это будет на много быстрее чем то-же самое реализовывать в 1С.
9. s22 22 27.03.24 17:20 Сейчас в теме
расчет себестоимости и план производства
10. PerlAmutor 155 27.03.24 19:59 Сейчас в теме
Хорошо бы в платформе и EDT такую штуку внедрить, а то конфигуратор и EDT кушают проц как не в себя при сравнении-объединении, выгрузке/загрузке XML файлов. А так было бы еще неплохо сделать интерфейс 1С с поддержкой 3D отрисовки как в Qt. Нейросети еще можно обучать на GPU.
Практического применения в расчете учетных данных придумать не могу. Все равно всё упирается в 99% в скорость работы БД, Вот когда придумают базу данных внутри GPU с энергонезависимой памятью тогда уже будет интересно.
12. KHoroshulinAV 171 27.03.24 21:59 Сейчас в теме
(10) 3D я пытался делать через браузер на WebGL, но на тек момент этот 1С не поддерживает браузер explorer как раньше. Нейросети - пожалуй.
14. DmitryKSL 157 28.03.24 09:53 Сейчас в теме
Скажите, была реальная проблема, или просто так сделали, и нет никакого практического применения? Мне просто непонятно какая может быть польза именно в 1С.
15. KHoroshulinAV 171 28.03.24 10:26 Сейчас в теме
(14)Представьте, производство, крупный заказчик, оборонка, сложный набор спецификации большая вложенность. Данных реально больше миллиона. И нужна обработка данных. - На стороне 1С такие вещи просто не реализовать. Ну или процесс займет недели.
16. DmitryKSL 157 28.03.24 15:14 Сейчас в теме
Опять не понял, это реальная ситуация или просто как пример? Что вы там обрабатывали на стороне? Я как-то копался в закрытии месяца 10 лет назад, чуть с ума не сошел. Как вы расчеты будете на сторону переносить? Там надо во-первых во всей логике разобраться, во-вторых при каждом ее изменении логику на стороне менять, что вообще кажется неприемлемым.
17. KHoroshulinAV 171 28.03.24 17:43 Сейчас в теме
(16)Да, Дмитрий, переносить всю логику, и да, если в логике появились изменения то придется алгоритмы править. Но это просто альтернатива текущим методам расчета.
19. NeLenin 14 11.10.24 10:00 Сейчас в теме
В целом любопытно и интересно. Однако самое интересное реализовано на джаве, и исходников этого интересного нет ((
23. KHoroshulinAV 171 18.11.24 09:32 Сейчас в теме
(19) на java реализована связка с vulkan. а сама логика расчета алгоритмов заложена в шейдерах. а это в целом текстовые файлы. И ее можно менять, логику расчета, не правя код на java
24. NeLenin 14 18.11.24 13:35 Сейчас в теме
(23) Да, Ваш вариант вполне имеет право на жизнь. Однако мы сочли его не очень удобным для реального применения. Коллега реализовал примерно такой же вариант в виде компоненты на C++. Без промежуточных файлов/бд, все процессы в памяти. ТЗ нужного формата через json передается в компоненту, оттуда уже в память видеокарты. Обратно расчет возвращается в ту же ТЗ. Такой вариант, скорее всего, работать будет быстрее (сравнительных тестов не делали, но и без них понятно), да и код на стороне 1с попроще. До реальной задачи пока еще не добрались.
Оставьте свое сообщение