Но, глядя на последние тренды в законотворчестве (EU AI Act, инициативы в США и Китае), у меня для вас плохие новости. Период "Дикого Запада" заканчивается. Скоро мы увидим жесткое разделение рынка, и привычные нам инструменты могут быть лишены ключевых функций или серьезно ограничены в возможностях.
Давайте разберем, почему ответы на сложные вопросы скоро исчезнут из паблика, как это ударит по бюджету компаний и почему умение развернуть Llama локально станет важнее подписки на OpenAI.
Почему гайки закрутят? (Проблема High-Risk)
Законодателей в Европе и США, волнует не то, как ИИ пишет код, а то, кто будет платить за ошибку.
Представьте ситуацию: вы спросили у ChatGPT совет по налоговой оптимизации или нюанс трудового права. ИИ ошибся (галлюцинация). Компания получила штраф. Кто виноват? Сейчас - пользователь. Но регуляторы вводят понятие High-Risk AI. К 2026-2027 годам публичные модели, скорее всего, получат жесткие программные ограничения (guardrails) на темы:
-
Медицина;
-
Юриспруденция и бухгалтерия;
-
Критическая инфраструктура;
-
HR и наем персонала.
Вместо ответа вы увидите заглушку: «Как языковая модель, я не могу консультировать по вопросам, подлежащим лицензированию».
Три сценария будущего (прогноз на 5 лет)
Исходя из текущей динамики, рынок расколется на три сегмента.
1. Consumer AI (Для масс)
Бесплатные или дешевые версии (условный GPT-6 Free). Отличный секретарь: напишет письмо, сделает саммари, сгенерирует картинку. Но на любой профессиональный вопрос будет выдавать отказ во избежание судебных исков к разработчику.
2. Enterprise AI (Для бизнеса)
Здесь останется полный функционал, но порог входа изменится.
-
Хотите, чтобы ИИ анализировал договоры или давал советы по бухучету? Покупайте доступ к сертифицированной модели (Legal-GPT, Fin-AI).
-
Доступ только через API, с логами, страховкой ответственности и ценой не $20 за юзера, а условные $5000 за корпоративную лицензию.
-
Бизнесу придется готовить бюджеты. Халява с использованием «гражданских» версий для серьезных задач закончится.
3. Local / Open Source (Киберпанк для технарей)
Единственный островок свободы. Локальные модели, развернутые в контуре компании или на личном сервере.
Техническая сторона сопротивления: к чему готовиться?
Если вы не хотите зависеть от цензуры облачных гигантов и бюджетов энтерпрайза, выход один - Self-hosted LLM.
Уже сейчас опенсорс (Meta Llama 3, Mistral, Qwen) дышит в спину проприетарным моделям. Но есть нюанс: чтобы получить от них результат уровня GPT-4, нужно железо и навыки.
Что нужно изучать сейчас, пока есть время:
-
Инструментарий запуска:
-
Ollama / LM Studio: Для быстрого старта и тестов на локальной машине.
-
vLLM / TGI (Text Generation Inference): Для продакшн-деплоя с высокой пропускной способностью. Понимать, как поднять API-эндпоинт, совместимый с OpenAI, внутри своей сети - это must have навык на ближайшие годы.
-
-
Uncensored & Abliterated:
-
Вам придется разбираться, чем базовая Llama-3-Instruct отличается от Dolphin-Llama-3 или версий с пометкой Abliterated.
-
«Аблитерация» (Abliteration) - это техника, когда из весов модели хирургически удаляют механизмы отказа. Такая модель ответит на любой технический или юридический вопрос прямо, без морализаторства и ссылок на директивы ЕС.
-
-
Железо и VRAM — новая валюта:
-
Забудьте про CPU. В мире локального ИИ правит видеопамять.
-
Чтобы запустить квантованную (хотя бы q4_k_m) модель на 70B параметров (которая реально умная), вам нужно 40+ ГБ VRAM. Это уровень двух RTX 3090/4090 с NVLink или профессиональных карт A6000.
-
Бюджет сервер компании нужно закладывать уже сейчас.
-
Главный посыл: Успевайте!
Мой прогноз таков:
-
Прямо сейчас: Используйте облачные ИИ на 200%. Генерируйте документацию, рефакторите легаси, пишите регламенты. Пока это дешево и доступно - выжимайте максимум. Это окно возможностей скоро сузится.
-
Готовьтесь к локализации: Если ваша компания работает с чувствительными данными (или вы просто не хотите, чтобы ИИ однажды отказался работать), начинайте эксперименты с локальными моделями.
-
Бизнесу: Готовьте деньги. Либо на железо для инференса внутри контура (On-Premise), либо на дорогие Enterprise-подписки. Эра "всезнающего бесплатного чат-бота" уходит.
Вопрос к сообществу:
Как вы думаете, насколько быстро зарегулируют отрасль?
Готовы ли вы разворачивать у себя в компании локальные "печки" с видеокартами, чтобы сохранить независимость от прихотей OpenAI и законодателей?
Другие статьи автора:
- Древняя УТ 10.3 (10.3.6.8) и маркировка товара: как обойтись без перехода на УТ 11.5 (мой практический опыт)
- Автоматическое обновление токенов Честного Знака в 1С: устраняем человеческий фактор
- Дубликатор кодов маркировки (КИЗ) DataMatrix: Расширение 1С с проверкой в Честном Знаке (копирует ЛЮБЫЕ КИЗы!)
- Маркировка остатков товаров на складе: Как сделать все быстро и без ошибок (мой практический опыт)
- Маркировка остатков в распределенной рознице: Как промаркировать более 100 тыс. товаров в нескольких десятках магазинов без хаоса и ошибок
Вступайте в нашу телеграмм-группу Инфостарт
