Свой карманный разработчик: на что способны локальные модели в реальных проектах

30.04.26

Интеграция - Нейросети

Мир ИИ меняется все быстрее, появляется куча новых моделей. И если раньше китайцы дистиллировали амеров, то сейчас вектор меняется и амеры начинают дистиллировать китайцев. Клауд 4.7 со своими 1,6Т параметров догоняет дипсик 4 с его 1,6Т, а Kimi 2.6 с 1Т решает задачи программирования лучше большинства программистов. Мы вступили в эпоху триллионных сетей, и это сильно влияет на прям вот вообще все.

Всем хайушки!

Статья написана вручную, если не считать заголовка - это джимми. Картинку запилил на своем компе, использовал модель "Tongyi-MAI/Z-Image-Turbo" от Алибабы.

 

О дивный новый мир?

В последнее время я увлекся вайбкодингом, т.к. с помощью этого у разработчика в общем-то пропадает привязанность к конкретному стеку.

Не сказать, что я вот вообще ноль во всем, помимо 1С, но и сказать, что я в чем-то неплохо разбираюсь, помимо опять же 1С, я не могу. И вот начавшаяся эпоха агентов для кодирования это все резко поменяла. Теперь я без особого труда мучу за пару дней игруху на котлине, а за пару часов - домашнюю бухгалтерию с OCR. При этом не заплатив ни цента за платные модели.

Предлагаю обсудить вайбкодинг с локальным инференсом, т.е. с запуском моделей для агента на своем железе. Почему "обсудить"? Потому, что я не хочу предложить одно свое правильное мнение, а хочу узнать у сообщества, как мы все это делаем, что получается, с какими трудностями сталкиваемся и как их преодолеваем. Так что добро пожаловать в комменты. И сами знаете - я никого не помещаю в черные списки, так что можете писать любую дичь, но в пределах правил площадки.

 

Немного истории

После того, как бум блокчейна несколько сошел и все небезразличные написали свои пару контрактов на Solidity (включая меня), наступила эра нейросетей. Все небезразличные закупились книжками и курсами (в то время они еще не были такой маркетинговой лютой дичью, какой стали сейчас), насмотрелись видосов, попробовали все эти ИИ-чаты и подуспокоились. Потенциал этого всего явно просматривался, поэтому и я закупился книжками и просмотрел все, до чего смог добраться. Коллеги активно разбирались с ML, рисовали все эти градиенты на плоскостях, вычисляли уровни ошибок и прочие метрики, разбирались с переобученностью моделей и прочими унылостями линейной алгебры. Я постоянно проходил мимо, смотрел с лицом, выражавшим понимание и одобрение. До уханьского насморка оставалось каких-то пару лет.

И уже тогда было понятно, что сети будут расти очень стремительно. Количество параметров производило качественные скачки в генерации текста, сети начали отвечать на вопросы куда лучше, чем токсичные разрабы на Stack Overflow. Стало ясно, что это всерьез и на долго.

Но переломный для меня момент начался с появлением агентов. Т.е. программ, которые дают сетке снести годы твоей работы с помощью "rm * -rf". Но это, конечно, крайний случай, ибо остальные команды, используемые сетью, генерируют код, собирают его, тестируют и создают MR в гит. Именно так я написал свой MCP для 1С.

Продолжим...

 

Почем опиум для народа?

Сеть на 1Т параметров кодит хорошо, но в твой компьютер не влезет. Хотя если взять квантизированную сеть, например в q3, то есть шанс разместить ее в компьютере с большим количеством ОЗУ (300Gb+), которое ныне дорогое (я покупал себе 2х48 DDR5 6400MT на старте почти продаж за 42к, а теперь оно стоит 100к+++, хотя есть 5600МТ и за 80к). Но если заставить это работать на процессоре, то результатов вы скорее всего не дождетесь, т.к. 2-3 токена/сек - это ну о-о-о-о-чень медленно.

И тогда что? Правильно, можно купить какую-нить подписку за какие-то деньги, после чего в твоем агенте будет работать сеть, кушающая электричество западного Китая. Стоит это для такого вот приличного вайбкодинга в районе 1000 юаней (не спрашивайте, сколько это - я не знаю).

Наверное это копейки по сравнению с зарплатой программиста, но мне боженька дал хорошую зарплату, поэтому я не буду прогибаться под систему и запилю свой инференс с блэкджеком и теми, кто не смог освоить джаваскрипт (ну вы ведь помните ту картинку, да? а теперь, заметьте, она утратила актуальность...)

 

Все свое!

Железо

Для того, чтобы запустить более-менее прилично пишущую код модельку локально, нужно 32 гига. В оперативке и на CPU скорость такая себе. Хотя если у вас стоядерный эпик с 1Тб/с пропускной способностью памяти, то можете и на нем, тем более что туда может влезть пару ведер оперативки. Но это как-то уж слишком дорого даже для меня. Поэтому я за 32 гига видеопамяти. Вот вам варианты поиметь столько:

1. На озонах есть серверные теслы с 32 гигами, переделанные под PCI-E. Стоят от 50к, но с ними гемор, т.к. там кастомный охлад и нужны специальные дрова. Ну и куча дополнительной суеты, если вы хотите на этом поиграть. Инференс уже 50+ т/с, что вполне прилично для вайбкодинга.

2. Можно купить 2 x AMD 9060XT - те же 32 гига, низкое энергопотребление, но занимают 2 слота, и для хорошей скорости требует хорошую материнку. По деньгам уложитесь в 70к и получите свои 60-80 т/с без геморроя. Вместо 9060XT можно взять 5060ti 16Gb - это будет на 20к дороже, но работать должно на 20-30% быстрее. 

3. AMD 9700 AI PRO. Это уже цена двух 5070ti, но вся память на одном девайсе, и при аналогичном TDP карточек одна будет в 2 раза менее прожорлива. Не знаю, какая скорость инференса, но у меня как раз 2x5070ti, что дает 150+ т/с, а это уже уровень хорошей подписки.

4. Если есть денежка, то нет ничего лучше 5090. Да, в 2 раза дороже, но и скорость примерно в 2 раза быстрее. Получите 250-300 т/с, а может быть и быстрее, т.к. все в одной карте.

5. Дальше идет 4090 48Gb. Слышал я, что не новую можно взять за 150к, но уверенности нет.

Да, этот чертов нумерованный список - это моя идея, иногда нумерация хороша, ни одна нервосеть не пострадала )))

 

Софт

Лично я запускаю модели на собранной вручную с кучей оптимизаций llama.cpp. Но для обычных людей на первое время подойдет и lm studio, в котором вы будете ставить модели одним кликом. Вообще, для запуска моделей есть куча софта, так что гуглите.

В качестве агента я использую opencode. В конфиге можно прописать использование локального провайдера. Но есть куча других - claude code, cursor, ... Погуглите - они каждый обновляются. Есть openclaw.ai - это твой домашний робот для компа.

 

Модели

Добрались до самого важного. Все эти агенты и студии не будут работать без моделей, а модели все очень разные. Давайте разберемся.

Параметры

Итак, у моделей есть основной параметр - количество параметров. Параметры - это веса в матрице. Входящие "токены" преобразуются в большие и красивые вектора, умножаются на матрицу слоев - на параметры, выбирается путь в определенных пределах, т.е. совокупность "сработавших" параметров на входящую последовательность. Получается новый вектор, и дальше он идет по слоям, превращаясь в ответ. Вся магия в том, что на основании входящих слов генерируется продолжение, т.е. то, что должно следовать за твоими словами из промпта. И чем больше этих параметров, тем шире поле возможностей нейросети. "Осмысленную" генерацию продолжений получили уже на нескольких лярдах, а сейчас триллионы параметров, при том математика тоже из простого перемножения и сигмойда несколько усложнилась - можете почитать что-то про трансформеры, которые в настоящее время вроде как лидируют по уровню осмысленности ответов.

Слои

Помимо параметров есть слои. Фактически они разделяются на несколько групп - слои внимания и слои связанности. Сначала идут слои синтаксиса и грамматики, все они пытаются определить первичные связи между словами. Дальше идут блоки семантики, которые улавливают смысл сказанного в том объеме, на которое способна сеть, дальше слои финальных определений и поиска следующих слов, которые нужно сгенерировать. Т.е. нейросеть продолжает то, что ты сказал, ну или то, что агент выдал ему из командной строки после запуска команды.

Ну и чем больше параметров, тем больше слоев, а чем больше слоев, тем более правильные слова подберет сеть для продолжения диалога. Ну или кода.

Токены

Токены - это преобразованные несколько букв/цифр/... - знаков - в числа. У модели есть хранилища токенов - большие json-файлы (или вообще txt), в них совокупность символов связана с токеном. Библиотека ИИ открывает этот файл и сопоставляет твои "блаблабла" с токеном(ами), возвращая какое-нить ["1234567", "6155241", .....]. В итоге в ходе некой дополнительной магии у тебя появляется вектор, который можно умножить на матрицы в модели. И слово превращается не просто в вектор токенов, а в большой красивый вектор с кучей пространств, отмечая свой вес в каждом из них. Т.е. вектор определяет положение слова в множестве пространств (живое/неживое, форма, цвет, ... - как игра в угадайку с да/нет, только "да" и "нет" тут размазаны в пространстве [0..1.0]. Типа цвет немного зеленый и синий, чуть фиолетового, ....)

В общем, размерность этих пространств легко переваливает за 10к, т.е. на каждое слово может получиться массив из 10к+ циферок. Вот они и будут в итоге умножаться на матрицы слоев.

Точность

Модели хранят веса с определенной точностью. Есть точность FP32, где FP - это float point, т.е. числа с плавающей запятой, 32 - это биты. Т.е. на 1Т параметров нужно 4Тб памяти. Есть FB16 - это почти FP16, но количество бит мантиссы и экспоненты отличается от FP16. Гугл это придумала для весов сетей. Но все еще для 1Т сетки нужны нереальные 2Тб памяти.

Квантизация

Хитрые людишки осознали, что 16 бит на вес - это очень много и можно ужаться. В принципе, при большом количестве параметров точность веса нивелируется объемом сети. Поэтому веса начали ужимать до 8 бит, а потом и до одного - до того самого да/нет. Скажем так, при восьми битах теряются доли процента, при шести все еще доли, но уже ощутимые, а при четырех уже единицы. Модель может начать ошибаться в похоже написанных словах (похожие переменные путать, например). Как защититься? Ну не называйте переменные похоже )))

Где искать модели?

Есть Hugging Face - сайт с моделями, датасетами и прочим. Ищите там. Читайте описания, пробуйте. Но перед этим прокачайте железяги.

 

Что и как удалось сделать с помощью локального ИИ

Итак, переходим к самому важному, иначе зачем эта статья вообще была бы нужна.

Но начну с самого важного вывода: любой человек, который может хорошо сформулировать - поставить - задачу, теперь программист на любом стеке. Да, неплохо было бы понимать, что и как работает под капотом хотя бы в общих чертах, ибо модель начнет предлагать тебе постгрес и редис для домашней бухгалтерии, докер и кучу всего того, что тебе вообще ни разу не нужно, но если понимание есть, то добро пожаловать в любой стек!

 

Как я делал игру на котлине

На начало работы у меня была только одна карточка 5070ti, поэтому я юзал Qwen 3.5 9b q6 - она с горем пополам влезала в память моей видеокарты и давала стабильные 120 т/с, т.к. это плотная сетка без MOE-слоев. И она с привеликим трудом смогла собрать мне приложение с пустым активити.

Я скачал "Qwen 3.6 35B A3E Q3" - сеть на 35 лярдов параметров с MOE, т.е. со слоями экспертов. Q3 - это квантизация до 3 бит, что позволило большую часть сетки засунуть в видеопамять. И вот тут произошел качественный сдвиг - сетка быстро и достаточно легко собрала мне первую активити с картинками.

 
 MainActivity

Картинки, кстати, скачала с какого-то сайта со свободными картинками.

Дальше я начал думать, что с ними делать. Сначала придумал раскраску, но быстро понял, что картинки не те. В итоге пришла в голову идея пятнашек - я любил в нее в детстве играть.

Поняв, что частичный инференс на видеокарте и CPU - это 20 т/с, которое мне показалось сильно медленным (после 120 на плотной модели, которая влезла в память видеокарты целиком), я решил купить вторую карту. Ну и до кучи к ней мать и корпус. Даже не спрашивайте, сколько это стоило - много. Сижу на гречке. Зато счастливый )))

Если вернуться к смой игре и именно процессу разработки, то дело было так (и да, опять нумерованный список):

1. Основной промпт - создать приложение с пустой активити. Начала делать 9b, у нее это получилось с большим трудом. Но она нашла или скачала мне нужные пакеты для сборки. Т.е. сама все нашла, скачала и описала, где брать и куда класть. На выходе приложуха с белым экраном. Ну может быт ьтам был хеллоу ворлд - не помню уже.

2. Добавить на нее картинки в сетке 2х8. Это уже 35b q3 на видеокарте + CPU с 20-ю токенами в секунду.

3. Добавить кнопку закрытия. С этим прям борьба была, пока она не сделала мне красивую оранжевую кнопочку с закругленными углами.

4. Добавить активити с паззлом. Тут уламывать пришлось несколько сессий. Но в итоге подвезли вторую карту и работа пошла веселее. Если вы умеете уламывать сговорчивых дамочек с поверхностным знанием js - точно справитесь )))

5. Убрать рамки, сделать приложение полноэкранным. Мгновенно без вообще проблем.

6. Добавить кнопку закрытия на активити паззла. Очень долго объяснял, что мне нужна ровно такая же кнопка, как на основной.

7. Несколько сессий рефакторинга с переработкой на MVC. Пару раз все сломалось, но модель все починила.

8. Добавил музыку. При том и промпт, и музыку нагенерили локально запускаемые нервосети. Промпт для музыки сделал прямо не выходя из кода, а музыка сгенерирована моделью ACE Step. И добавление в приложение этой музыки заняло минуту.

Ну и для каждого шага просил реализовать, собрать, установить на устройство и остановиться. Дальше тестил, сообщал о проблемах, если были, просил продолжить, если проблем нет или они были решены.

 
 Активити паззла

Дальше было несколько сессий для фич: звук кнопок, счетчик ходов, секундомер. В итоге выложил на рустор. Напишите в комментах, работает ли оно у вас на девайсе. А то приятель один написал, что на его хоноре паззл не тапается. Для этого в последней версии я попросил ИИ написать отображение состояния. В него можно переключиться при долгом тапе на любом участке паззла.

В итоге собранное приложение с 16-ю картинками и музыкой получилось уместить в APK меньше 5 Мб.

 

Домашняя бухгалтерия

Ну ладно, игры на котлине - это хорошо, но у нас тут бухалтерский сайт. А у меня давно была задумка сделать систему, которая просто с отправленных ей в телеге (или чем там ща отправляют) фоток чеков зафиксирует расходы. Для этого пришлось разобраться, как заставить модель видеть фотки. Оказалось, что нужна еще одна модель - проектор. В llama.cpp есть соответствующий параметр для запуска такого вот проектора.

И здесь модель запилила приложение за две сесии. В первой сессии она сделала фронт и бэк, во второй сессии добавила правку категорий и транзакций, написала промпт для нейросети на распознавание чека и заполнение полей транзакции из чека. Планирую добавить загрузку чеков из галереи смартфона. Осталось заставить себя фоткать чеки.

 
 В итоге получилось как-то так:

 

Заключение

Да, мир изменился. И да, даже на локальном компе, доступном с зарплатой современного программиста, можно вайбкодить, при том достаточно интересные штуки.

И, к сожалению для 1С, похоже подходит ее время, т.к. модели уже в состоянии переписать весь этот код всяких там ЕРП и УХ на более производительный стек. Да, программист тут нужен, но не как писатель кода, а как контроллер процесса. И сдается мне, что займет процесс переноса ЕРП в части используемых в организации модулей условную неделю. Может быть я тут излишне оптимистичен, но лет через 10 это будет происходить вообще за минуты.

Вступайте в нашу телеграмм-группу Инфостарт

Вы можете заказать платную адаптацию этой статьи под ваши задачи на «Бирже заказов».

  • 0% комиссии — оплата напрямую исполнителю;
  • Исполнители любого масштаба — от отдельных специалистов до команд под проект;
  • Прямой обмен контактами между заказчиком и исполнителем;
  • Безопасная сделка — при необходимости;
  • Рейтинги, кейсы и прозрачная система откликов.

См. также

Инструментарий разработчика Нейросети Платные (руб)

Первые попытки разработки на 1С с использованием больших языковых моделей (LLM) могут разочаровать. LLMки сильно галлюцинируют, потому что не знают устройства конфигураций 1С, не знают нюансов синтаксиса. Но если дать им подсказки с помощью MCP, то результат получается кардинально лучше. Далее в публикации: MCP для поиска по метаданным 1С, справке синтакс-помощника и проверки синтаксиса.

15250 руб.

25.08.2025    55582    111    29    

124

Нейросети Пользователь 1С:Предприятие 8 1С:Управление нашей фирмой 1.6 1С:Управление торговлей 11 1С:Управление нашей фирмой 3.0 Оптовая торговля, дистрибуция, логистика Россия Управленческий учет Платные (руб)

Расширение "Искусственный интеллект и нейросети в 1С: Работа с отзывами маркетплейсов" предназначено для применения искусственного интеллекта в повседневной деятельности селлеров на маркетплейсах. Среди функций - работа с отзывами, вопросами и чатами покупателей, диалог с нейросетями, генерация картинок, заполнение описаний номенклатуры и другое.

6100 руб.

03.04.2024    15482    8    0    

12

Нейросети Бесплатно (free)

Представляю open-source платформу, написанную на Go, с 1С-подобным языком — для публикации пет-проектов, MVP и прочих домашних бухгалтерий. Сразу оговорюсь: платформа **не production-ready**. В ней есть куча багов, наверняка немало неоптимальных и спорных решений, но есть и плюс — при желании каждый может её доработать и улучшить. Если не нравится конфигуратор — берём и переконфигурируем его к чертям 🙂 И самое приятное, конфигурации для этой платформы легко вайбкодятся! А если упираемся в ограничение платформы, то тот же агент может её и допилить.

22.05.2026    1923    Ibrogim    81    

44

Нейросети Инструментарий разработчика Запросы Программист 1С:Управление торговлей 11 Абонемент ($m)

Консоль запросов: добавлен ИИ-помощник (запрос в DeepSeek), который помогает быстрее получать каркас Запроса 1С Сформулируйте простое описание; нажмите кнопку – получите результат прямо в консоли. Где дальше его можно дорабатывать и тестировать.

2 стартмани

20.05.2026    4720    17    German4739    39    

19

Работа с интерфейсом Нейросети Системный администратор Программист Руководитель проекта 1С:Предприятие 8 Бесплатно (free)

Эту статью породила моя случайная встреча в московском метро с женщиной, которой я помог донести торшер. Оказалось, что это театральный реквизит, она сама - режиссёр, а её муж - 1С-ник и мой старый друг. В очередной раз я поразился, как тесен мир, и как, порою, неслучайны случайные встречи! Мы созвонились с другом, и он мне рассказал о своих экспериментах с искусственным интеллектом на проектах "снеговика" с интерфейсом на обычных формах, купирующих проблемы предприятий, у которых за многие годы накопилось столько доработок, что поддержка конфигурации стала огромной болью, особенно, в связи с регуляторными изменениями последних лет. И не поддерживать морально устаревшие конфигурации тоже нельзя, т.к. апгрейд до последних версий на управляемых формах обойдётся кратно дороже. Я ему предложил написать статью на Инфостарте, но он наотрез отказался публиковаться под своим именем, и мне с трудом удалось уговорить его опубликоваться от моего имени, что я и делаю.

18.05.2026    2167    RayCon    10    

26

Логистика, склад и ТМЦ Нейросети Программист Пользователь 1С 8.3 1С:Управление нашей фирмой 3.0 1С:УНФ Управленческий учет Абонемент ($m)

Внешняя система аналитики закупок для 1С на базе FastAPI + PostgreSQL + Docker с поддержкой локального AI через Ollama. Возможности: — рекомендации по закупке; — ABC / XYZ анализ; — поиск неликвидов; — поиск излишков; — анализ сезонности; — риск дефицита; — AI-пояснения рекомендаций. Решение работает через HTTP API и может использоваться как внешний аналитический сервис для 1С. Поддерживается локальный AI без облачных сервисов и без передачи данных наружу.

10 стартмани

14.05.2026    602    2    aldar    1    

6

Нейросети Программист Бесплатно (free)

Современные LLM-агенты страдают от одной архитектурной болезни: они обязаны ответить всегда. Даже когда контекст пуст, даже когда данных нет, даже когда любой ответ будет галлюцинацией. Это порождает шум, эрозию памяти и ложную уверенность. В нашей архитектуре агент не имеет права генерировать ответ, если недостаточно света. Перед любой попыткой срабатывает L8 — pre-execution constitutional gate. Он измеряет покрытие контекста (context_coverage), прогнозирует уровень шума (noise_estimate) и выносит вердикт: разрешить, ограничить, верифицировать или заблокировать.

14.05.2026    476    ksnik    20    

6

Нейросети 1С 8.3 1С:ERP Управление предприятием 2 1С:Управление торговлей 11 1С:Зарплата и Управление Персоналом 3.x Абонемент ($m)

Данная публикация представляет расширения для конфигураций 1С: УТ 11, ЗУП 3.1, ЕРП 2.5. Расширения позволяют выгружать любые данные из всех типовых отчетов (в них добавляется кнопка DeepSeek (см. скрин)), а также через встроенный конструктор запроса; хранить промты для нейросети с параметрами из 1С; отправлять запросы в DeepSeek, получать и обрабатывать ответ. Реализована автоматическая обработка результата: поиск таблицы в ответе нейросети и вывод её в табличный документ. Предусмотрена возможность перехватить ответ и написать свою обработку — полученную таблицу значений можно использовать для загрузки в табличную часть, создания документов или заполнения регистров. В публикации — описание возможностей, настройки, примеры промтов и шаблон обработки-перехватчика.

2 стартмани

13.05.2026    517    1    German4739    1    

7
Комментарии
Подписаться на ответы Инфостарт бот Сортировка: Древо развёрнутое
Свернуть все
1. starik-2005 3272 30.04.26 17:23 Сейчас в теме
Сделал бота @dietologqwn36bot. Фотку ему с едой, он ответит по диетологически. Вайбкодинг занял 19 минут.
mrsmrv; Xershi; +2 Ответить
2. Diversus 2339 30.04.26 18:04 Сейчас в теме
Все равно локальные модели не сравняться по качеству с ТОП LLM. С другой стороны если использовать максимальную модель Claude Code - это $200 в месяц и ты не упираешься в лимиты. Как будто смысла в топовом локальном оборудовании нет + оно же устаревает
3. starik-2005 3272 30.04.26 18:11 Сейчас в теме
(2)
$200 в месяц
2 видюхи окупятся меньше чем за год при таком раскладе. Но я эти модели юзаю и иначе.
4. Diversus 2339 30.04.26 18:37 Сейчас в теме
(3)
2 видюхи окупятся меньше чем за год при таком раскладе. Но я эти модели юзаю и иначе.

А качество моделей?
5. starik-2005 3272 30.04.26 19:24 Сейчас в теме
(4)
А качество моделей?
Игруху видели на котлине?

Что есть вообще качество? Модель запускается с окном в 150к+ токенов. Мне для всего хватает.
6. Diversus 2339 30.04.26 19:33 Сейчас в теме
(5) Пятнашки видел. С другой стороны, если все устраивает, то почему нет :)
Просто я пробовал разные модели и они реально не дотягивают до Claude (по крайней мере пока). Что будет дальше? Возможно модели шагнут и станет реально их использовать для 80% задач. Тогда смысл будет. Но это мой кейс, как у других не берусь говорить.
46. starik-2005 3272 04.05.26 11:33 Сейчас в теме
(6)
Просто я пробовал разные модели и они реально не дотягивают до Claude
Проанализировал "качество". Есть море тестов в этих наших интеренетах, которые для разных моделей показывают, как они справляются с соответствующим набором. И сейчас все очень неоднозначно. Есть тесты, где локальный Qwen 3.6 35B справляется лучше, чем Claude, есть тесты, где Claude прям топчик (и таких тестов действительно много), но также очень много текстов, где Claude не на первом месте или даже далеко не на первом. Китайские модели в тестах на чистое программирование и голую математику обычно луче, чем Claude. GPT 5.5 во всех этих тестах лучше, чем Claude Opus 4.7. В агетском программировании тоже все по-разному уже на сегодняшний день, т.к. модели чуть ли не каждый день новые выходят. Вот мистраль плотный 128B вышел на днях - он прям в большинстве тестов, которые приведены у него в описании, лучше, чем Claude, а этот мистраль влезет в AI 395+ MAX за 220к на Озоне и даст условные 10 т/с с 256к контекстом (а больше и не надо в действительности, т.к. даже Claude начинает на контексте 200к+ мутить и приходится словеса волшебные говорить, хотя вроде бы).

В общем, если вайб-кодинг - это когда ты менеджер процесса разработки, то небольшие модели с локальным инференсом могут быть не сильно хуже топовых. Если же ты хочешь самоустраниться и чтобы модель писала все за тебя, то и нужды в тебе в конторе (если это не твоя контора) скоро не будет. И да, тут Claude конечно же лучше.
7. DmitryKlimushkin 30.04.26 19:37 Сейчас в теме
я искренне и честно пытался прочесть. Но большую часть слов я не понимаю, а в контекст этой проблематики я даже не знаю как и входить (да и надо ли?) Поэтому чтения не получилось, я на третьей строке потерялся.
smit1c; evn-zorin; Andrey_Timofeev; +3 Ответить
11. starik-2005 3272 30.04.26 21:13 Сейчас в теме
(7) Третья строка - это которая?
Предлагаю обсудить вайбкодинг с локальным инференсом, т.е. с запуском моделей для агента на своем железе. Почему "обсудить"? Потому, что я не хочу предложить одно свое правильное мнение, а хочу узнать у сообщества, как мы все это делаем, что получается, с какими трудностями сталкиваемся и как их преодолеваем. Так что добро пожаловать в комменты. И сами знаете - я никого не помещаю в черные списки, так что можете писать любую дичь, но в пределах правил площадки.
Вайбкодинг - сейчас этим термином называют генерацию кода с помощью нейросети. Инференс тут расшифрован, т.к. это запуск нейросетей. Локальный - на твоем (моем) железе.

В статье я вообще рассказываю простым языком о том, что такое все эти модели, чем они характеризуются. А под капотом там линейная алгебра. Не верю, что в столь древние времена этому учили на столько плохо, что матрицу на вектор умножить с помощью калькулятора сейчас не сможешь. А если сможешь - так в чем проблема с пониманием.

Основная суть в том, что я пишу софт, не видя кода. Да, непривычно, ну так и уровень прораба не в том, чтобы он кирпичи таскал, а в том, чтобы тот, кто должен таскать кирпичи, их таскал. Теперь и мы - программисты - переходим на уровень прораба, теперь наша задача не таскать кирпичи, а помогать таскающим кирпичи незаменимым специалистам делать это хорошо и отлично.
Andrey_Timofeev; +1 Ответить
17. DmitryKlimushkin 30.04.26 23:10 Сейчас в теме
(11) Никак не сформулирую... не даётся. Попробую.
В школе (на литературе, кажется) изучали такое явление. Называлось "чистое искусство". Думаю, что помнишь.
Так вот именно с таким явлением у меня и возникают ассоциации уже применительно к нашей сфере. Никак не могу представить - в каком контектсе или какой проблематике надо находиться, чтобы стало интересным или полезным применение всего того, что ты описал, а я нифига не понял. Это точно, как в "чистом искусстве" один поэт писал стихи другим таким же поэтам, ну и в музыке та же фигня "композитор для композитора". А в какой момент вся эта байда становится полезна тому, кто за это, собственно, собирается платить? Нет ничего проще, чем писать программу для другой программы. Я такое явление регулярно наблюдаю. Коллеги радостно пишут "оболочки для оболочек", "конфигураторы вместо конфигураторов", "расширения для удлинений" и "удлинения для расширений". Я это назвал "полировкой лопаты". Вот для этой фигни какой-то ИИ регулярно оказывается полезным ибо все задачи, им решаемые выглядят, как "те же яйца, только - сбоку", а ИИ прекрасно умеет крутить эти яйца. ИТ-шники создали себе какой-то свой "маня-мирок", где радостно погрязли в "чистом коде", где код ради кода. Пользуну с того чего ждать? Надо подключить чудовищный ресурс, чтобы сверстать примитивненькую игрушку для офисного планктона?
Мне трудно понять - в какой проблематике вы находитесь, те, кто обсуждают вопросы такого рода. Кто за подобное платит?
alex-sa; 1CJunior; +2 Ответить
18. starik-2005 3272 30.04.26 23:27 Сейчас в теме
(17) Чистое искусство - оно такое.

По поводу ИИ, то он знает - не поверишь - алгоритмы. То, о чем я давно писал, что программистам это почти негде использовать, ибо библиотеки, а потом и фреймворки. Все уже отсортировано за них, все уже найдено за них. Одна 1С осталась болезная, что не может приличного ППД сделать, а то что есть - оно очень специфично, ибо сложно придумать такое, чтобы пользователь в динамическом списке и не мог найти телефон по последним 4-м цифрам, а метасимволы там не работают, т.е. "*5555" написать можно, но работать не будет. При том в форме ПТП оно работает, правда типовая так сделана, что лучше бы и не делали. А хочешь прикрутить это к своей большой таблице, так изволь проблем огрести с тем, что если в выборку попало тыщ сотня, а всего там пяру лямов, то ты просто никогда не дождешься, пока все эти элементы тебе отдадутся.

И вот в итоге остается одна такая на земле отдельно стоящая 1С со своим программированием ради программирования и постоянными проблемами, которые мы, такие, героически решаем.

И вроде бы при чем тут ИИ. По моему разумению при том, что ну не может бизнес всевечно в неведении оставаться относительно того, что за месяц эта самая ИИ перепилит ихний оперативный функционал, с которым основной гемор, на приличный стек с модульным тестированием хоть каждой процедуры, хоть каждой функции - благо там они на такие слова не делятся. И можно оставить лицензию только в бухгалтерии, в которой лютые бухгалтера жмут кнопари отправки всего этого по ЭДО. Ну может еще банковские выписки грузят. Ну пусть. Там и типовой хватит. Но и это тоже перепилить проблем нет. ИИ уже справится.
h00k; Andrey_Timofeev; +2 Ответить
21. DmitryKlimushkin 01.05.26 07:58 Сейчас в теме
(18)
Но и это тоже перепилить проблем нет. ИИ уже справится.

Ну... на уровне курсовой работы, возможно - справится. Я, кстати, из-за подобного не могу выносить так называемые "проверочные задания" на собесах. Начинается предельно тупо (как в ИИ!) - "Возьмите абстрактный склад и представьте.... бла-бла-бла..." Сцуко! Я не могу представить абстрактный склад! Все склады для меня предельно конкретны! Мне надо положение (приказ) о складском учёте прочесть, приказ об учётной политике увидеть. Это уж как минимум.
Я в ум не возьму, как в гуманитарной (учёт - сугубо гуманитарная задача!) области можно создать типовой алгоритм. И как в этом алгоритме учесть, например, такой аспект, как "профессиональное суждение"? Это когда учёт опирается на субъективное мнение профильного спеца (не бухгалтера!), которое и определяет полноту, достоверность и значимость в учёте.
Вот почему арифметика, одна - на весь мир, а бухучётов удивительное множество, никто не задумывался? Вроде бы, "язык" один, так зачем так много "диалектов"? Ответ-то на виду - гуманитарные вопросы мы рассматриваем через очки своих ментальностей. поэтому одной точки зрения и не существует.
Вот по поводу 1С с тобой точно соглашусь. Завязли они, сломавшись на конъюнктуре. Когда начал угождать ларёчникам - забудь о высоком полёте)
22. starik-2005 3272 01.05.26 09:13 Сейчас в теме
(21)
Мне надо положение (приказ) о складском учёте прочесть, приказ об учётной политике увидеть. Это уж как минимум.
Ужс...
Я в ум не возьму, как в гуманитарной (учёт - сугубо гуманитарная задача!) области можно создать типовой алгоритм.
Учет придумали давно, но формализовали его итальянцы с помощью двойной записи, т.е. если где-то уменьшилось, то где-то увеличилось. Да, экономика - гуманитарная наука, а вот учет - это синтез. И если у тебя приехали апельсины бочками, то килограммы там тоже есть.
которое и определяет полноту, достоверность и значимость
И где это в 1С? Там приход, расход, при желании разделенный на количественный и суммовой - ордерный. Повод для творчества дает только инвентаризационная ведомость. Но это творчество завсклада, директор магазина, дальше сами знаете что следует при достаточном уровне творческих способностей, и сразу становится ясно, зачем тут консерватория.
Завязли они, сломавшись на конъюнктуре.
Они просто старые уже и видят хреново. Элемент вон родили, но я вообще не понимаю, зачем, если на реакте это нарисовать можно "методом прораба" (буду так называть).
25. DmitryKlimushkin 01.05.26 09:28 Сейчас в теме
(22) Если чо, то итальянцы придумали простую форму учёта - одномерную. Двойная запись родилась на севере Европы, в Голландии (всё-таки, первая буржуазная страна), как ответ на усложнившееся производство, ставшее "многопередельным". Куча адептов "управленческих учётов" даже и не предполагает, что двойная запись это и есть тот самый производственный учёт, которым так грезят "ЕэРПэшники")
Насчёт места возникновения "гуманитарности" - указано точно. Но мы, как разработчики должны же предусмотреть "грядки" для будущего размещения этой гуманитарности. В одних сферах она возникает в одном виде и месте, в других секторах экономики расположение этих "грядок" может быть иным.
Вот есть сельское хозяйство. В нём есть отрасль - животноводство. При этом, животноводством будет корова, свинья, баран, коза (но это ещё что-то однородное!), а потом пойдут птицы (от перепелов до страусов), а дальше - рыба! И разница в деловых практиках (соответственно, и в учетных операциях) будет совсем разная. Как это уместить в некий абстрактный общеупотребимый алгоритм - у меня пока в голове не укладывается)
27. starik-2005 3272 01.05.26 09:53 Сейчас в теме
(25)
Если чо, то итальянцы придумали простую форму учёта - одномерную. Двойная запись родилась на севере Европы, в Голландии (всё-таки, первая буржуазная страна), как ответ на усложнившееся производство, ставшее "многопередельным". Куча адептов "управленческих учётов" даже и не предполагает, что двойная запись это и есть тот самый производственный учёт, которым так грезят "ЕэРПэшники")

Ну у меня другая информация:
Двойная запись — метод бухгалтерского учета, при котором каждая операция отражается одновременно по дебету одного счета и кредиту другого. Система сформировалась в XIII–XV вв. в итальянских городах-государствах из-за роста торговли. Первое научное описание опубликовал Лука Пачоли в 1494 году, что заложило основы современной бухгалтерии.Основные этапы истории двойной записи:Возникновение (XIII–XV вв.): Метод развился в Северной Италии, где купцам требовался строгий учет финансовых операций.Публикация (1494 г.): Лука Пачоли в труде «Summa de arithmetica, geometria, proportioni et proportionalita» описал систему «венецианского учета».Терминология (XVI в.): В 1525 году Антонио Тальенте впервые использовал термин «двойная запись» в своей книге «Светоч арифметики».Развитие: Метод получил дальнейшее развитие в трудах итальянских математиков.

И заметь, я пруфы пощу. Учись, студент. finbiz.spb.ru/wp-content/uploads/2005/10/4_2005_zygan.pdf, например.
Но мы, как разработчики должны же предусмотреть "грядки" для будущего размещения этой гуманитарности.
Вокруг поле непаханное, а тут с грядками. А все по синусойде:
А. Фуллстек ->фронт/бэк -> специализация -> фуллстек-синьоры -> ...
Б (параллельно): Монолит -> Зоопарк -> Микросервисы -> Платформы...
Вот кода платформы, то все непаханное - грядки. А у большинства зоопарк, они на первых ступенях эволюции архитектуры, их еще ждет открытий чудных...
Вот есть сельское хозяйство. В нём есть отрасль - животноводство. При этом, животноводством будет корова, свинья, баран, коза (но это ещё что-то однородное!), а потом пойдут птицы (от перепелов до страусов), а дальше - рыба!
Вспомнил анекдот про альтернативу - утки!
И разница в деловых практиках (соответственно, и в учетных операциях) будет совсем разная.
Красава!
Как это уместить в некий абстрактный общеупотребимый алгоритм - у меня пока в голове не укладывается)
Корову на запчасти попилить ща ЕРП "искаропки" не умеет - это да, но ума там прикрутить сверху что-либо не надо особо. Мы как-то народу MES на коленке за 3 месяца написали, так от ЕРП они смогли отказаться, а от MES - нет, хотя честно попытались внедрить вместо нее коробку.
28. DmitryKlimushkin 01.05.26 10:47 Сейчас в теме
(27) Мне бы ваши проблемы( Никак не наберу критичную дозу вдохновения, чтобы, сидя на телеге, мечтать о полётах к Альфе Центавра.
Ты под ноги посмотри) На какой почве стоим? Всё ЭТО сначала надо на уровень банального здравого смысла привести. Какой там ИИ?? Человечек сидит в коммерческом учёте и мечтает о "бюджетировании". Вот что в башке должно у него быть? И самое забавное, ИИ что-то такому персонажу предложит ведь!
Я никак не могу начать писать код, как просто программу. Меня сразу на землю "стягивает", я вхожу в роли менеджеров, управленцев, тех же главбухов. И меня корёжить начинает от той тупизны в которую я могу их погрузить, реализуя вроде бы, их же просьбы.
alex-sa; 1CJunior; +2 Ответить
29. starik-2005 3272 01.05.26 11:14 Сейчас в теме
(28)
Человечек сидит в коммерческом учёте и мечтает о "бюджетировании". Вот что в башке должно у него быть?
Ну он паттернами мыслит, т.к. попросить бюджета на "бюджетирование" и "казначейство" - это красиво, а просить бюджет на что-то другое - это "неформат". С другой стороны, бюджетирование и планирование, завязанные на казначейство - это правильный вектор развития организации, т.к. нужно учиться управлять рисками, а то будет как у одного автора, которого уволили, миллионные долги. А как управлять рисками, если ты не рубишь в методологии и не слышал про резервы на обесценение. Но я еще раз повторюсь: пока в компании архитектура на уровне зоопарка, когда они даже и помыслить не могут о микросервисах, а тем более платформах, они и в учете реализуют банальную партионку, героически сводя все это при закрытии каждого периода. И правильные их мечты о систематизации учета упираются в ИТ, который даже не видит, что их зоопарк - это лишь вторая ступенька эволюции информационных систем.
30. DmitryKlimushkin 01.05.26 11:32 Сейчас в теме
(29) Насчёт "правильного вектора" - это кем такое решение принято? В рамках какой методологии?
Правильные слова не всегда означают верные решения.
Резервы под сомнительные долги, резервы под обесценивание - давно известный и вполне понятный механизм для квалифицированного менеджера и бухгалтера - тоже! И вот тут возникает вилка развития событий. Менеджер должен быть квалифицированным и понимать значение слова "фонд"! Но менеджмент отупел и ему, вместо изучения "базы", хочется "а ля финансовую Википедию". И он начинает изобретать ту модель, которую он считает - будет проще освоить. Вот изобрели "бюджетирование". Только ленивый этим не занят. Почти уверен что в ИИ уже есть некие "модели" такой блажи) И у этого тупенького менеджмента даже мысль не возникает, что до них люди были совсем не тупее их и ели бы существовала методологическая модель "бюджетирования" в хозяйственной системе учёта, то она давным-давно была бы описана и внедрена в деловые практики. Так нет же! Доморощенные "Лейбницы" в себя поверили и решили мир удивить) Типа, "до нас была сплошная тупизна (у них же компуктеров не было!), но тут пришли мы со своей Википедией и научим вас портянки на складах считать!"
Это не вектор развития. Это попытка слабого спортсмена схалявить на дистанции и попытаться срезать угол на маршруте, в попытке обогнать более развитых конкурентов. Сойдя с маршрута завязли в болоте. У кого там "бюджетирование" заработало? Судя по спросу в вакансиях на компетенцию "гроссмастер по бюджетированию", в это болото угодили многи и сейчас идёт интенсивный перебор "волшебников"))
47. starik-2005 3272 04.05.26 13:16 Сейчас в теме
(30)
У кого там "бюджетирование" заработало?
16 лет назад работал в конторе, в которой работало и бюджетирование, и казначейство. У конторы не было долгов - были фонды как раз, было свое производство. Только отдел маркетинга иногда выдавал удивительное и непредсказуемое, т.к. не смогли заменить действительно шарящую в этом, но ушедшую куда-то в даль, руководительницу. И сейчас в такой работаю - тут тоже строго все в части бюджета. В итоге компания покупает другие компании. А те компании, где про аудит что-то слышали, что он есть где-то там в Big4, продаются.
48. DmitryKlimushkin 04.05.26 13:50 Сейчас в теме
(47)
шарящую в этом

То есть, необходимым условием работоспособности чего бы то ни было служит обязательное наличие некоего "шарящего"?) Тебе, самому, такая ситуёвина понравилась бы?
И кстати, она "шарила" в чём? Можно огласить некую предметную область знаний? Или это уникальный дар, а не универсальное знание?
Вот это беда наших коллег. Многим кажется, что виртуал это дополнение и расширение реальной жизни, а не её отражение, как есть (должно быть!) на самом деле. Перед любым проектированием, выслушав очередную "хотелку" очередного спятившего менеджера, первым делом - убедись, что желаемое этим несчастным существует в реальной жизни. Иначе ты ступишь на тропу под вывеской "А давай попробуем!".
Ни в чём она не "шарила". Просто есть такие персонажи. Оказавшись среди застенчивых и интеллигентных, они резво поднимают вымпел "Я здесь самый умный!", окружающие деликатно и интеллигентно позатыкались и молчат. Вот так рождаются "авторитеты") Нельзя создать в виртуале то, чего сроду нет в реальной жизни в виде оформленных методик и математически описанных закономерностей.
"Это у вас в лесу единорогов нет, а я щас напишу программу, где будет целая ферма дойных.... единорогинь!". Это примерно так выглядит применительно к программам учёта. Так же стрёмно смотрится и слушается.
49. starik-2005 3272 04.05.26 14:15 Сейчас в теме
(48)
И кстати, она "шарила" в чём?
В маркетинге. Ты чем читаешь? Маркетинг в тамошнем обособленном сегменте вряд ли преподают в ВУЗах. В них преподают общие подходы, а дальше "файнтюнинг" методом проб и ошибок, пока уровень ошибки не опустится ниже допустимой. Ты ж умный, ты ж линейку в институте изучал - давай, напрягись.
Ни в чём она не "шарила".
Я тут не свое мнение высказал, а мнение коллег. Я ее уже не застал к тому моменту. То, что пришедшие ей на смену "шарили" сильно меньше - это застал, но сравнивать не с чем было, так что вывод мой - это пересказ слов коллег, которые застали и могли сравнить. Но, вижу, ты-то вот точно знаешь. Молодец.

ЗЫ: в одной конторе у нас поменялся директор ИТ. И вот по новому было сразу (ну почти - взяли же его по какой-то причине) видно, что он не шарит.
8. Ibrogim 1704 30.04.26 19:45 Сейчас в теме
+ за статью и за опыт и за то, что теслу помянули )

У нас есть целый отдел мл и локально трудятся карточки (распознованиефото, транскрибация и т п.) но для кодинга подписки все же выгоднее по соотношению цена качество(мое ИМХО)
starik-2005; Diversus; +2 Ответить
34. avbolshakov 01.05.26 19:40 Сейчас в теме
(8) не сможете подсказать какую модель по подписке можно попоробовать, но так чтобы без впн? я попробовал через aitunnel sonet и квен платные. и очень понравилось в сравнии с бесплатными, с которыми дает опенкод работать. но платить за токены очень не выгодно. но зато этот аи туннель позволяет без впн работать.
65. starik-2005 3272 14.05.26 11:11 Сейчас в теме
(8)
подписки все же выгоднее по соотношению цена качество
Вот у нас сейчас постоянно доступы глючат. Вчера попросил клауд вывести список полей регистра в табличку. В итоге не дождался - сам сделал.

С другой стороны, дома сейчас юзаю ik_llama.cpp с моделькой Qwen 3.6 27B MTP IQ4_KS - очень быстрая dense-модель (плотная), которая на моем домашнем компе до 200к токенов позволяет контекстное окно держать при начальной скорости 60+ т/с., которая к 150к токенам падает всего до 30 т/с. Т.е. очень все супер-пупер неплохо. Скормил ей Войну и Мир Толстого (1/5 часть романа) - очень неплохой анализ сделала, на все вопросы ответила. На вопрос, как Безухов получил наследство, сказала, что прямого указания на то, как именно, нет, но да, как-то он его получил.100к токенов прочитала, не путалась. При более развернутом вопросе сказала, как точно произошло дело и как отжали у него часть средств по непутевости. В целом по роману очень неплохо использовала поиск. Например, как французы обманули австрийцев у моста. Подметила детали, которые я не заметил при чтении. Ответила на вопрос о том, как русские обманывали французов. При том 35B, которую я решил тоже протестить, вообще сказала, что русские не обманывали, хотя и признала, что Денисов обманул двух генералов и как Багратион не повелся на провокацию французов, когда они захотели провернуть то же, что с австрийцами и обманул их в ответ. В общем рекомендую )))
9. starik-2005 3272 30.04.26 21:03 Сейчас в теме
(8)
но для кодинга подписки все же выгоднее по соотношению цена качество
Я вот до сих пор не смог понять про "качество". Это количество итераций до момента, когда приложение заработает? Длинна сожранного контекста для того, чтобы приложение заработало? Время, которое тратит модель, чтобы приложение заработало? Количество уточнений разработчика для того, чтобы ...?

Ну вот с челом знакомым поболтал сегодня, а он, такой, типа а может твоя сеть по фотке КБЖУ? Я, такой, а как нефиг делать и попросил написать бота для телеги (в (1) скинул ссыль на него). Но я решил, что он должен отвечать, как диетолог. Что он, собственно, и делает. 20 минут на все про все. Это качество какое?
14. Ibrogim 1704 30.04.26 21:58 Сейчас в теме
(9) Если пишешь на стеке который не знаешь то тут да без разницы в целом. Даже если знаешь но нужен просто результат, просто mvp то тоже безразницы. Есть задача есть решение, работает значит качество ОК.

Но если ты пишешь не mvp и есть разные ограничения то тут начинается разница.
Со скольки попыток она сделает то, что нужно. Не чтобы оно заработало как то, а именно как надо.

Причём для некоторых задач реально безраницы какая модель пишет.
например вот тут все скрипты я писал бесплатным (на тот момент) qwen'ом и я думаю, что opus справился бы также. Но сколько раз было у меня что Qwen или GLM тупит и делает не так как надо. Да сделает, но в два раза дольше, после кучи уточнений (скорее всего дешевле правда)

Это один в один как с сотрудниками. Есть Мидлы, есть Джуны. Джун сделает, но будет тебя отвлекать, и дольше будет делать, за несколько итераций (и тоже возможно дешевле)

Ты руководитель. Тебе решать )

Например в 1С qwen может пока ограниченный круг задач решать ну или
это сильная боль ( всё это конечно моё имхо)
16. starik-2005 3272 30.04.26 22:03 Сейчас в теме
(14)
Например в 1С qwen может пока ограниченный круг задач решать ну или
это сильная боль ( всё это конечно моё имхо)
Я где-то тут написал, что в 1С не юзаю, т.к. у 1С очень сложный "пайплайн" тестирования образца кода.
А по поводу клода, то вот тебе один мой секрет: я сижу сейчас на "Qwen3.6-35B-A3B-Claude-4.6-Opus-Reasoning-Distilled.Q4_K_M.gguf"

Но да, модель с 35B параметров не может конкурировать с моделью в 1,6Т параметров на равных. Это ёжику понятно. Но то, что дистилят многие вопросы решает, для меня стало очевидно.

Но и Опус 4.7 очень даже тупит местами и его нужно пинать. Вот, например, у меня есть сэнтри, я с нее скриптом ошибки вытаскиваю и прошлу Опус изобразить в конфлюенсе по аналогии красоту. Он делает, но первоначальная красота для него недостижима, пока не пнешь пару раз.
10. aximo 2691 30.04.26 21:11 Сейчас в теме
ну так что в итоге? гора все-таки родила мышь или еще в процессе?
12. starik-2005 3272 30.04.26 21:15 Сейчас в теме
(10)
гора все-таки родила мышь
А я-то тут при чем? У того, у кого мышь рождалась, как я понял подвижки в этом деле.
13. Шёпот теней 1786 30.04.26 21:24 Сейчас в теме
Любой процесс оценивается лимитирующей стадией.

Раньше нетленку писали люди теперь ИИ.

Если ты такой умный то почему ты не такой богатый.

... вот ...

п.с.0. то, что "starik-2005" умнее умнейшего спору нет. В авторитете!
п.с.1. народ благодарен за популяризацию ИИ.
п.с.2. хочется сказать "и? и? и?, что дальше?"
п.с.3. ни, что так легко не воруется как "цифровые" предметы и технологии.
п.с.4. когда я был молодым верил, что компьютерные программы помогут людям.
1CJunior; +1 Ответить
15. starik-2005 3272 30.04.26 21:59 Сейчас в теме
(13)
что дальше?
Жили они жили, и померли (с).
ни, что так легко не воруется как "цифровые" предметы и технологии
Оттого все эти сети в большинстве своем открытые или вообще МИТ-лицуха. Типа бери, юзай, за все сам отвечаешь.
компьютерные программы помогут людям
Так и колбаса людям помогает, но когда кушаешь ее без хлеба пару месяцев и больше ничего - см. п.1.
20. Шёпот теней 1786 01.05.26 06:09 Сейчас в теме
(15)

что сделано:
1. куплено оборудование
2. изучена документация
3. потрачены часы на создание (см. ниже)

создано:
1. игрушка "15"
2. чтение чеков

... СЕРЬЁЗНОвотСЕРЬЁЗНО ..
alex-sa; Diversus; ixijixi; DmitryKlimushkin; 1CJunior; aximo; +6 Ответить
23. starik-2005 3272 01.05.26 09:16 Сейчас в теме
(20)
создано:
1. игрушка "15"
2. чтение чеков
Далеко не все. Бот для телеги - виртуальный диетолог, два варианта игрушки "мемори", одна для планшета. MCP-сервис для 1С. То, что процитировано, создано за условные четыре дня, в которые я разбирался, какие модели использовать и как. Вечность впереди, идей прям вот масса! И я теперь не ограничен стеком.
Но давай так: а сколько времени на это понадобилось бы тебе?
31. Шёпот теней 1786 01.05.26 13:13 Сейчас в теме
(23) starik-2005

"Что может говорить хромой об искусстве Герберта фон Караяна? Если ему сразу заявить, что он хромой!"

Четыре дня. Пусть будет по 8 часов. Итого 8*4 = 32. Стоимость такого эксперта как "starik-2005" думаю .15 тыс. в час как минимум. Итого 32 * 15 = 480 тыс. руб.

За такие бы деньги бы сделал. За такое время - нет. Но я бы не стал это делать!? Время на ветер и деньги я думаю то же.

п.с.0. Какой вклад всего компьютерного мира в производстве мира!? По разным оценкам от 3 до 6 процентов.
п.с.1. Мы все "нахлебники". От нашего труда в целом мало, что зависит.
п.с.2. Единственное где огромный рост связанный с компьютерами это рост производства самих компьютеров.
п.с.3. IBM хотела сократить штат, внедрив ИИ, но в итоге сотрудников стало только больше. Это как раз то, к чему приводит внедрение компьютеров в целом и надежда на него.
33. Cocky_Idiot 37 01.05.26 18:51 Сейчас в теме
(31)
Четыре дня. Пусть будет по 8 часов. Итого 8*4 = 32. Стоимость такого эксперта как "starik-2005" думаю .15 тыс. в час как минимум. Итого 32 * 15 = 480 тыс. руб.
За такие бы деньги бы сделал. За такое время - нет. Но я бы не стал это делать!? Время на ветер и деньги я думаю то же.

А книжки? Книжки эксперту можно читать? С таким рейтом, чем бы человек не занимался в свободное время - любая деятельность будет на ветер. Даже спать не стоит, ибо, по вашим раскладам, ночь такого специалиста стоит 1600$

п.с.0. Простой бот, отвечающий на отзывы клиентов маркетплейсов, заменяет штатного отвечалу на удалёнке с зарплатой 50к на руки, это 850К в год. Но вы там продолжайте считать...
35. starik-2005 3272 01.05.26 21:10 Сейчас в теме
(33) (31)
Стоимость такого эксперта как "starik-2005" думаю .15 тыс. в час как минимум.
Возьму на вооружение, а то недоплачивают, собаки )))
37. starik-2005 3272 01.05.26 21:14 Сейчас в теме
(31)
IBM хотела сократить штат, внедрив ИИ, но в итоге сотрудников стало только больше
Когда что-то цитируешь, нужно внимательно посмотреть первоисточник:
Под искусственным интеллектом в данном случае понимается бухгалтерский чат-бот AskHR. С его помощью IBM собиралась автоматизировать до 30 % повторяющихся задач от учёта персонала до начисления зарплаты. В итоге компания смогла доверить ИИ-агенту 94 % рутинных задач по управлению персоналом. Это высвободило до $3,5 млрд и повысило производительность по более чем 70 направлениям бизнеса IBM.

Генеральный директор IBM Арвинд Кришна (Arvind Krishna) прокомментировал ситуацию: «Несмотря на то, что мы проделали огромную работу по внедрению ИИ, общее число наших сотрудников на самом деле увеличилось, потому что это позволило нам больше инвестировать в другие области».
Т.е. ИИ сократил штат эйчеров и бухов, а на сэкономленные деньги они запустили другие направления.
45. DmitryKSL 186 04.05.26 10:01 Сейчас в теме
(20) Ну если бы изначально была цель у него заработать, то наверно нет смысла. Но это же как хобби. Я вот по вечерам иногда сам машиной занимаюсь. Не потому что денег на сервис нет, а потому что нравится с железками возиться.
Да и программки на другом стеке пишу время от времени, интересно же, разве нет? Ну смотрел бы сериалы или зависал в соцсетях, чем лучше?
h00k; starik-2005; +2 Ответить
52. Шёпот теней 1786 04.05.26 14:56 Сейчас в теме
(45) Поддерживаю!

У меня детей много - поэтому сам машину ремонтирую. И интересно и денег экономлю и за качеством слежу.

Каждый по своему с ума сходит.

п.с.0. Вот в машинах сделал инжекторы. Экономия условная. Есть удобства. В целом эффективность нулевая - расходов больше.

... вот ...
66. starik-2005 3272 14.05.26 11:27 Сейчас в теме
(52)
И интересно и денег экономлю и за качеством слежу
У меня друг один все старается делать сам. Ну вот прям совсем все. Ну кроме как я понял ремонта дома - муж сестры матери этим занимается профессионально, поэтому смысла ноль. А вот машину, велосипед, компьютер даже (а он вообще юрист, а сейчас риэлтор) - все сам. Думаю, что если дать ему ИИ в виде опенкода и приличную модельку, то он далеко нас позади оставит в своих творениях.
67. Шёпот теней 1786 14.05.26 15:30 Сейчас в теме
(66) столько условий... столько условий ... ох, сколько же условий...
и ИИ дать и модельку и ещё чего-нибудь ... сколько всего надо дать, чтобы что?
Вот весь интернет живёт за счёт военных и порнушки вот ...

... и вот уже радио в каждом доме, а счастья всё нет."

Компьютерные технологии ничего не дают человечеству кроме компьютерных технологий. А ресурсов требуют огромные.

Слабость системы оценивается её самым слабым звеном.

ИИ - это воровство.

... вот ...
68. starik-2005 3272 14.05.26 16:02 Сейчас в теме
(67)
и ИИ дать
А что тут с условиями? Вандама пусть берет - и все. Это и есть "моделька". Облачных моделек много, GPT 5.5 и Клауд (пусть будет Жан Клод Ван Дам) - в топе, самые дорогие. Но и делают прям вот хорошо, что им скажешь. Есть другие - они дешевле.
Компьютерные технологии ничего не дают человечеству кроме компьютерных технологий. А ресурсов требуют огромные.
Как-то в юности пришел устраиваться в хорошую региональную контору - Трактороцентр. Там очень интересный владелец был, рассказывал, как они там по полдня на советских базах снабжения получали свои запчасти. А сейчас, говорил он, за минуту все делается. А ты тут мне втираешь.

Да одна электронная очередь мне нервов столько сэкономила, сколько ни один корпоративный психолог не сможет )))
19. Cocky_Idiot 37 01.05.26 00:12 Сейчас в теме
Отдельный респект - за информацию о вариантах в виде серверных тесл и китайских 4090 на 48Gb. Получается, что при наличии рук, можно реально всё собрать в бюджете < 300К.
Сделать свою сборку железа для запуска локальных моделей - мечта идиота, но ценник кусачий для хоббийной истории - супруга не поймет, завидую вам белой завистью.
Лично у мну пока получается обходиться gemini-cli: оно не просит денег вообще, там бешеное окно контекста, в модели "gemini 2.5 pro" токенов на рабочий день хватает, а если упёрлись - оно деградирует на gemini flash, которая тоже неплоха. Цепляется к MCP(пользуюсь вашим MCP для 1С): в EDT из встроенного терминала прекрасно рефакторит мой говнокод.
А ещё оно работает на телефоне в termux: у ней при этом есть wget, curl, bash, python, черта лысого, и она имеет доступ к ФС телефона: получается почти полная замена ноуту.
Вот прямо рекомендую, ибо халява - священна (с)
Viktor_Ermakov; +1 Ответить
24. starik-2005 3272 01.05.26 09:22 Сейчас в теме
(19)
А ещё оно работает на телефоне в termux: у ней при этом есть wget, curl, bash, python, черта лысого, и она имеет доступ к ФС телефона: получается почти полная замена ноуту.
Звучит интересно. Тем более у мелкой s10 ultra 14"+++, у меня поскромнее - lenovo xiaoxin 12.7".
"gemini 2.5 pro"
Юзаю локально гему 4 31B периодически, но она "плотная" (Dense), поэтому работает сильно медленнее. Вообще про гему:
Gemma 4 E2B (Effective 2B): Сверхлегкая модель для мобильных устройств и IoT. Поддерживает текст, изображения и нативный ввод аудио.
Gemma 4 E4B (Effective 4B): Оптимизирована для работы на ноутбуках и планшетах. Как и версия 2B, является мультимодальной (текст/фото/аудио).
Gemma 4 26B A4B (MoE): Разреженная модель на архитектуре Mixture of Experts. Имеет 26 млрд параметров, но при каждом запросе активирует только 4 млрд, что делает её быстрой и эффективной.
Gemma 4 31B (Dense): Самая мощная плотная модель в линейке. Она предназначена для сложных рассуждений (reasoning) и агентных систем, требуя при этом больше видеопамяти (около 58 ГБ в режиме 16-бит).
Но по наблюдениям 31B плотная хуже Qwen 35B MoE. И не только тем, что медленнее - она картинки хуже понимает.
Gemini Flash: Оценочно от 10 до 20 млрд параметров (быстрая модель).
Gemini Pro: Оценочно от 200 до 500 млрд параметров (универсальная модель).
Gemini Ultra: Оценочно 1.5+ триллиона параметров (самая мощная модель, вероятно, на архитектуре MoE).
Ультра на уровне топовых будет.
26. starik-2005 3272 01.05.26 09:36 Сейчас в теме
(19)
Получается, что при наличии рук, можно реально всё собрать в бюджете < 300К.
Можно 2x5060ti 16Gb взять. Сборка выйдет в 150к. www.dns-shop.ru/cart?share=56663fed-483e-4dc8-b931-85f74786c03e - что-то такое, но это самый базовый вариант )))
Viktor_Ermakov; +1 Ответить
32. Шёпот теней 1786 01.05.26 13:36 Сейчас в теме
(26) давно я тАААк не смеялся ....

п.с.0. Хорошее спонсорство военного АПК то ли США то ли Китая то ли обоих...
п.с.1. Скоро интернет станет стоит настоящих денег.
п.с.2. ИИ либо обанкротится либо будет стоить настоящих денег забрав у реального производства все ресурсы.
п.с.3. Весь интернет это либо военные либо порнушка. Видимо ИИ то же будет на том же держаться.
п.с.4. IBM хотела сократить штат, внедрив ИИ, но в итоге сотрудников стало только больше.
п.с.5. Сколько стоило обслуживать 1С 7.7 и сколько 1С 8.х!?

... вотКУЧАбаблаКУЧАвот ... ..
36. gybson 13 01.05.26 21:11 Сейчас в теме
Получается как с автомобилем примерно затрат и мороки. Не для каждого.
Но для состоятельных кротов тема хорошая.
38. starik-2005 3272 01.05.26 21:18 Сейчас в теме
(36)
Получается как с автомобилем примерно затрат и мороки.
Как с обычным компом. Если взять эппл за лям, то ни мороки, ни затрат. 800 ТОПС - уровень хорошей видеокарты, а внутрь влезет сеть 200B++.
39. gybson 13 01.05.26 21:23 Сейчас в теме
(38) у меня и автомобиль подешевле ляма :)

Два сына - 4060 x 2, жене ноут, тут себе не много остается

Есть ноут с 1060 3Гб, посмотрю что на нем взлетит, квен вроде есть на 2.5 гига моделька
40. starik-2005 3272 01.05.26 21:28 Сейчас в теме
(39)
квен вроде есть на 2.5 гига моделька
Ну как бы даже и не знаю. У меня 9b моделька на питоне неплохо писала, а на котлине не смогла толком.
41. gybson 13 01.05.26 21:42 Сейчас в теме
(40) мне не для писать, это пока на больших моделях
мне для повседневных нужд, для ботов на основе ИИ, просто агентских систем типа код-ревью и что-то такое
42. mrsmrv 129 02.05.26 18:08 Сейчас в теме
интересно, кто-то использовал такую железяку?
AMD Ryzen AI Max+ 395, RAM 128 ГБ
43. starik-2005 3272 03.05.26 20:45 Сейчас в теме
(42)
AMD Ryzen AI Max+ 395
Суммарная производительность AMD Ryzen AI Max+ 395 составляет 126 TOPS. Этот показатель складывается из мощностей различных блоков чипа:NPU (нейронный процессор): выделенный движок XDNA 2 обеспечивает до 50 TOPS.
Остальные блоки (CPU + GPU): совместно добавляют еще 76 TOPS, что в сумме дает 126 TOPS для всей системы.
В принципе норм: https://ozon.ru/t/3h2NTbZ
44. starik-2005 3272 03.05.26 21:25 Сейчас в теме
(42)
128 ГБ
211к - тоже неплохо.
53. mrsmrv 129 04.05.26 19:10 Сейчас в теме
(44) там фишка в том, что память скоростная (8000) и каналов там в два раза больше чем у "обычных" райзенов. Ну т.е. для встроенного GPU как бы хорошо. И объём под GPU можно выделить 96 гиг, под виндой и до 124 гиг под линуксом. Можно такие машинки стекировать, у некоторых вариантов есть по два 10 гигабитных порта, а есть возможность ещё "расширять" через type-c там два по 40 гигабит.
50. Viktor_Ermakov 401 04.05.26 14:21 Сейчас в теме
Автору спасибо большое за статью. Очень полезный материал.
Я вот думаю купить 5060ti 16Gb - 2 штуки, или все же 5070ti 16Gb - 2 штуки. Разница в деньгах тоже х2...
А в производительности и "качестве" не понятно.
51. starik-2005 3272 04.05.26 14:35 Сейчас в теме
(50)
5060ti 16Gb - 2 штуки
Мамку придется купить к ним, ибо в дешманских потребительских мамках 2-й слот - это PCIe 4.0x1 (если он вообще есть, при том он x1 даже если выглядит как x16). И поискать мать, которая умет 5.0x8/x8 - это прям вот непростой ребус. 2x5070ti на 50% быстрее, но в 1,7 раза прожорливее. Я свои придушил до 250W.
58. Viktor_Ermakov 401 05.05.26 16:20 Сейчас в теме
(51) Материнку я уже купил хорошую, там можно несколько карт использовать х8.
5060ti 16Gb - 2 штуки эти тоже могу себе позволить.
2x5070ti на 50% быстрее, но в 1,7 раза прожорливее
а вот эти уже дороже сами по себе, ну и электричества я так понял больше жрут... не понятно для дома хватит ли 5060
59. starik-2005 3272 05.05.26 16:22 Сейчас в теме
(58)
Материнку я уже купил хорошую
А подробности можете?
60. Viktor_Ermakov 401 06.05.26 08:21 Сейчас в теме
(59) MSI MPG Z890 Carbon WIFI LGA 1851
starik-2005; +1 Ответить
54. Perfolenta 207 05.05.26 01:54 Сейчас в теме
я дотошный... вычитываю то, что навайбкодил...
вывод: код получается работающим только на первый взгляд...
потом выясняется, что чем больше в приложении накапливается сгенерированного кода, тем меньше стабильность приложения... а начиная с некоторого количества кода глючность становится главным фактором и трудно устранимой... становится бесполезным просить модель исправить ошибки, т.к. она порождает массу новых ошибок...
Если за пару промптов ошибку исправить не удалось, то лучше уже и не пытаться, а откатится и искать ошибку самому, так как ИИ в дальнейших попытках просто испортит много хорошего рабочего кода...
Хотя, иишка не плохо справляется с поиском идей на счет того где может быть ошибка, так что польза всё равно есть... :)
Самый лучший результат модели дают тогда, когда похожие приложения уже есть в сети... условный тетрис модели хорошо пишут на любых языках...
В любом случае пользу из работы с ИИ извлечь удаётся... так что будем жевать кактус дальше... :)
55. starik-2005 3272 05.05.26 10:19 Сейчас в теме
(54)
выясняется, что чем больше в приложении накапливается сгенерированного кода, тем меньше стабильность приложения... а начиная с некоторого количества кода глючность становится главным фактором и трудно устранимой... становится бесполезным просить модель исправить ошибки, т.к. она порождает массу новых ошиб
И какой надо из этого сделать вывод?
Вариант 1: ну его.
Вариант 2: нужно проводить сессии рефакторинга.

Вообще, любой код превращается в спагетти, если его не ревьвюить. Оставь разработчика и 1С наедине, и через какое-то время там будет куча спагетти с огромным морем технического долга. Разраб пока умеет сжимать контекст до сущностей, у ИИ для этого есть какие-нить agents.md. Поэтому после сессии надо обновлять доку. Все планы надо просить писать в файл, после чего с новой сессии просить производить изменения.

Ну вот, например, моя игра. Там были определенные моменты. Например, при перевороте экрана музыка обрывается на время поворота. Я позавчера обновил убунту на 26.04, а вчера попробовал пересобрать - не работает. Оказалось, что при обновлении осталась последняя java - 25, а для проекта использовалась 21-я. Поставил 21-ю, поменял актуальность (вспомнил, что уже так делал, когда собирал первые версии). В итоге все собралось. Модель за пару сессий разобралась со всеми проблемами и обновила документацию. Попросил ее составить план изменений на будущее.

ЗЫ: кстати, скачал себе GLM 4.7 Flash - отлично кодит, но на длинных контекстах ее уносит в даль...
61. Perfolenta 207 06.05.26 13:33 Сейчас в теме
(55)
(55)
И какой надо из этого сделать вывод?

Вывод такой, если каждое ревью плавно переходит в переписывание кода, то ну его, возможно ручное написание меньше времени и сил отнимет... а если в конкретной программе ревью идут хорошо, то можно продолжать с ИИ...
Ну и от типа ПО много зависит.. не хотелось бы, что бы разработчики систем самолета писали код с помощью ИИ... пусть лучше с помощью ИИ ошибки в коде ищут и другую вспомогательную работу делают...
Польза от работы с ИИ точно есть, тут уж не поспоришь...
62. starik-2005 3272 06.05.26 14:02 Сейчас в теме
(61)
Вывод
Ну как-то так это все и работает. Ты ставишь задачу - получает MVP. Дальше собираешь идеи, фильтруешь, вносишь в план, запускаешь агента по плану с отчетом по каждому пункту и остановкой на проверку. В итоге у тебя просто список задач для агента и обновляемая краткая и емкая документация для отслеживания состояния проекта, чтобы в следующей сессии агент быстро включался в работу с небольшим набором стартовых токенов. Каждые N сессий сессия рефакторинга с проверкой стандартов по чеклисту.
56. mrsmrv 129 05.05.26 14:10 Сейчас в теме
на хабре пару дней назад про Nvidia Spark статья и там что понравилось:

AI-агент не делает тебя умнее. Он делает тебя быстрее в том, в чём ты уже хоть как-то разбираешься.
57. starik-2005 3272 05.05.26 14:19 Сейчас в теме
(56)
Он делает тебя быстрее
Ну тоже хорошо. В действительности, ИИ просто снимает ограничения. Вот хочешь ты игруху запилить для телефона, ну или еще какую софтинку (у меня тут масса идей всегда). И вот ты без ИИ по мануалам что-то такое пытаешься сделать, кликая мышкой а андройд-студио, добавляешь все эти слои, но если что, то приходится бегать по тем же стековерфлоу в поисках ответа, почему у тебя там что-то не собирается. В итоге ты, такой, с величайщим трудом запилил кривое и косое свое первое хуллоу-ворлд и сказал, что ну его нафиг - пока за это бабок не платят, так что не буду. А теперь ты, такой, к ИИ: напиши мне программульку под андройд. И она, такая, пишет. И да, тоже не без проблем, но пишет. И в итоге у тебя за неделю приколюшная игруха на котлине, вылизанная сессиями рефакторинга, разбитая на модули, собранная в apk и aab, опубликованная в русторе. Я вот прям даже не представляю, сколько бы времени убил, разбираясь с достаточно слабо мне известным стеком, чтобы написать такое.
63. Perfolenta 207 06.05.26 14:19 Сейчас в теме
(57)
в итоге у тебя за неделю приколюшная игруха на котлине

у тебя да, но в целом ситуация идет к тому, что в магазинах появляются сотни и тысячи однотипных поделок, среди которых хрен выберешь нормальную, т.к. на это просто нет времени, что бы перепробовать их все...
я уже задолбался удалять в видеохостингах рекомендации каналов с ИИ контентом, а они как грибы после дождя появляются новые и новые...
а теперь еще пошла массовая "каверизация" музыки с помощью ИИ... иишные картинки приелись... в общем что-то тут не здоровое есть... :(
стало ощутимо попахивать знаменитой теорией мертвого интернета... а с учетом сгенерированных статей и комментариев на сайтах, вообще приходит мысль их больше не читать...
64. starik-2005 3272 06.05.26 15:42 Сейчас в теме
(63)
а теперь еще пошла массовая "каверизация" музыки с помощью ИИ
Для народа это фон. Старикам режет слух, тинейджеры уже не могут без этого. Я мало что смотрю - пять примерно каналов с разной регулярностью на рутубе. Музончик слушаю - в основном русский рок с примесью классики. Но больше книжечки советской и зарубежной фантастики, хотя в последнее время несколько российских авторов послушал - мне понравилось. А вот "Бункер", по которому сериальчик сняли, со второй части как-то скучен стал...
Для отправки сообщения требуется регистрация/авторизация