Метрики тщеславия. Как понять, какие метрики вам не нужны?

07.05.26

Управление проектом и продуктом - Канбан и поставка ценности

Почему клиенты на самом деле выбирают исполнителя и какие метрики действительно отражают их ожидания, а какие – лишь создают иллюзию контроля? Разбираемся, как определить свое положение в глазах клиентов (и почему NPS уже не дает нужной глубины), как проверить «здоровье» продукта и качество доставки ценности через дизайн, исполнение и поставку. Вы узнаете о четырех типах метрик – от критериев выбора до драйверов улучшений – и поймете, почему «метрики тщеславия» делают счастливыми компанию, но не клиента, хотя их часто ошибочно включают в KPI. В заключение сформулируем практические выводы о том, как точнее попадать в ожидания клиентов и получать от них устойчиво позитивный отклик.

Поговорим про метрики: какие они бывают, что с ними делать, на что обращает внимание клиент и как он выбирает исполнителя.

Начнем с двух цитат. Первая принадлежит Эдвардсу Деммингу: «Неправильно полагать, что если вы не можете измерить, вы не сможете этим управлять – это дорогостоящий миф».

Вторая цитата, которая мне понравилась, когда я готовил статью: «Управлять бизнесом или командой без метрик – это бесспорно талант».

Есть противоречие: можно управлять с метриками, можно без метрик.

Есть специалисты и компании с разным уровнем организационной зрелости. У всех ситуация разная: кто-то маленький стартап, кто-то фрилансер, а кто-то представляет крупные организации, где работают тысячи человек и больше.

Личный пример: провал в клиентском сервисе

Перед написанием статьи у меня возникла любопытная ситуация. Так как я работаю на международном рынке и мне нужно было оформить свои дела в Казахстане, я начал искать облачное решение. Я зашел на сайт, по-моему, выбрал фирму, мне предложили связаться с ней. Я связался. На изображениях – результат того, как происходил диалог. Мне представились, спросили, что нужно. Я честно написал, что именно требуется. Ответ на мое сообщение я получил более чем через две недели, что меня удивило. Я задумался: вероятно, что-то пошло не так.

Почему сервис оказывается таким образом организован?

Анализ предложенных метрик выбора партнера

Я начал разбираться и пытаться понять, почему так происходит и по каким критериям вообще выстраивается работа с клиентами. Я зашел на сайт, на главной странице увидел список метрик, по которым клиентам предлагается выбирать исполнителя:

Число сертификатов 1С:Специалист
Общее число опубликованных решений
Число пресс-релизов, опубликованных на сайте «1С»
Число 1С-Совместных решений
Число человек, обученных в ЦСО
Число сертификатов преподавателей ЦСО
Местонахождение фирмы
Наличие у фирмы сертификата ISO
Я дополнительно вставил метрику, которая находилась в другой части страницы – как часто вы посещаете сайт Инфостарта?

К этим метрикам я еще вернусь.

Разрыв между измерениями компании и критериями выбора клиента

Подумайте, какие метрики измеряете вы, работая с клиентами. На эту тему можно провести целый воркшоп. Если вы выпишете или хотя бы задумаетесь над тем, что измеряете, список может получиться довольно большим. Число метрик постоянно растет. Организации любят что-то измерять, узнавать о своих клиентах.

Важно помнить, что измерение не бесплатное. Это одна сторона. Другая сторона – есть клиент. Как клиент я оперирую ограниченным количеством метрик, когда что-то выбираю.

Представим, что я хочу купить машину. Это сложная покупка, в голове много мыслей, много требований. Но каким количеством критериев вы как клиент реально оперируете? Сколько критериев у вас в голове, когда вы что-то выбираете или покупаете?

Пять? Пять – это достаточно высокая цифра. Если у вас в голове пять критериев, вы любите основательно подумать, чтобы выбрать точно. Очень часто этих критериев один-два.

И тут возникает разрыв: мы измеряем огромное количество параметров, а клиент выбирает по одному-двум. Что теперь с этим делать? Ответ, конечно, есть.

Я немного расскажу про фреймворк. Он называется по-русски «соответствие назначению», по-английски – Fit For Purpose (F4P). Авторы – Дэвид Андерсон и Алексей Жеглов. Я кратко пройдусь по этому фреймворку, а затем вернусь к метрикам и продолжу разговор...

Три компонента продукта: дизайн, реализация, поставка

Продукты, которые вы разрабатываете или услуги, которые оказываете, состоят из трех частей: дизайн, реализация и поставка.

Если взять в качестве примера пиццу, то дизайн – это рецепт, то есть способ ее приготовления.

Реализация – сам процесс приготовления.

Поставка – способ доставки пиццы клиентам: автодоставка, самовывоз, пешая доставка и другие варианты.

Если взять фирму-франчайзи как классический пример, то дизайн определяется 1С, то есть все строится на платформе 1С. Я, если честно, не слышал, чтобы франчайзи продавали решение не на базе 1С, полностью самописное, хотя такое, вероятно, существует.

Реализация тоже может различаться: либо это решения фирмы 1С, и тогда все полностью про 1С, либо собственные разработки формата «1С:Совместимо». Поставка однозначно остается на стороне франчайзи.

Когда-то, больше двадцати лет назад, я сам работал у франчайзи и представляю, как этот бизнес устроен. Думаю, он не сильно изменился. Все общение с клиентами происходит через франчайзи. Клиенты напрямую в 1С, думаю, редко обращаются, чтобы решать мелкие вопросы.

Теперь мой пример. Как тренер я тоже работаю в системе «дизайн – реализация – поставка». Дизайн классов определяется минимальными требованиями стандарта – в моем случае это Kanban University.

Реализация обычно дана на откуп тренеру: что включить, какие кейсы использовать, как выстроить процесс. Поставка – полностью история человека, который преподает: лекционный или нелекционный формат, онлайн или офлайн, множество вариантов.

В вашем случае вы можете представить, как выглядят эти три элемента – дизайн, реализация и поставка – для продукта или сервиса, который вы оказываете.

Четыре группы метрик

Есть четыре группы метрик, и мы пройдемся по ним по очереди.

Критерии соответствия

Первая группа связана с тем, почему вас выбирают клиенты. Она называется критерии соответствия. В этих критериях важно знать пороговые значения.

Пример из жизни: я прихожу в кафе, заказываю кофе, и мне приносят холодный кофе. Нарушается критерий соответствия – кофе должно быть горячим. Если вы оказываете сервис ниже порога, это плохо для бизнеса.

Но существует и верхний порог – так называемый оверсервис, когда вы оказываете слишком высокий уровень сервиса.

Пример из практики: если вам нужно привезти бетон, и компания готова доставить его за 15 минут, это, вероятно, не хорошо ни для компании, ни для клиента. На стройках планируют заранее, и точность до минут не требуется. Для компании же это слишком дорого, затраты растут, и бизнес становится неконкурентоспособным.

Эту категорию метрик стоит использовать как KPI.

Индикаторы здоровья

Следующая категория метрик – индикаторы здоровья. Это своего рода «пульс» системы. Эти метрики полезно измерять, но есть нюанс: по большому счету они не дают достаточного количества информации. Это фоновые значения, на которые стоит обращать внимание.

Человеческий пульс – хороший пример. Когда я выступаю на сцене, у меня пульс высокий. Сижу – низкий. Утром я побежал, пульс вырос. Потом лег отдыхать – он снизился. По отдельным значениям непонятно, что происходит.

Но если я вижу, что мой пульс стабильно высокий, то раз в полгода делаю ЭКГ, и кардиолог знает, что мой пульс выше среднего среди его пациентов и его это напрягает, – это уже сигнал.

Если у вас есть параметры, на которые нужно обращать внимание, они часто связаны с ближайшими улучшениями, о которых мы говорили на предыдущем изображении – критериях соответствия.

Если у вас клиент получает холодный кофе, вам нужен индикатор здоровья, который покажет, что кофе не успевает остывать. Метрики индикаторов здоровья часто связаны с предыдущей группой: они могут относиться к количеству клиентов, качеству и другим аспектам.

Эти метрики нет смысла включать в KPI. Это пороговые индикаторы, как красная лампочка. Если она постоянно горит, значит, есть проблема, которую нужно понять и устранить.

Метрики улучшений

Следующая категория – метрики улучшений. Это короткие ближайшие цели, на которые нужно обратить внимание.

Если что-то пошло не так, если вам нужно построить новую продуктовую линейку или решить другую задачу, фокус следует направлять именно на метрики улучшений – на те показатели, которые отражают ближайшие цели.

Метрики тщеславия

И последняя, моя любимая категория – метрики тщеславия. К ним относится большинство метрик, если начать разбираться. Сюда входят такие примеры: «самый лучший франчайзи года», «лучший сотрудник года», «работник месяца» и многое подобное.

Эти метрики приятны, сотрудники их любят, они делают организацию счастливее, но у них есть одна большая проблема: они никак не связаны с вашими клиентами.

Иногда встречаются метрики вроде «самый худший сотрудник» или «самая худшая команда». Это плохой паттерн, но такое бывает.

И самое интересное – такие метрики иногда включают в KPI. Это очень плохо, если подобные показатели оказываются в KPI.

Приоритизация метрик

И здесь нужно расставлять приоритеты. Приоритет выглядит так:

На первом месте – фитнес-критерии, то есть понимание того, что нужно вашим клиентам. Если вы фокусируетесь на этих метриках, вы выигрываете в конкурентной борьбе. Важно поддерживать их в зеленой зоне.

Далее идут драйверы улучшений – метрики, которые дают ближайшие цели и понимание того, как улучшать фитнес-критерии. На коротком промежутке времени вам может потребоваться добавить новые показатели, чтобы оставаться в форме.

Периодически смотрим на индикаторы здоровья, чтобы ничего не сломалось. А если остаются время, деньги и желание, можно заняться метриками тщеславия.

Стоимость измерений и разные точки зрения

И еще раз подчеркну: измерение не бесплатно, даже если все настроено автоматически. В крупных интерпрайзах любят собирать большое количество метрик «на автомате», но даже в этом случае требуется время и ресурсы, чтобы настроить сбор, поддерживать его, реагировать на изменения внешней среды. Что-то всегда уплывает, что-то нужно корректировать – затраты возникают неизбежно. Если вы работаете с клиентами на рынке и проводите опросы, собираете обратную связь и так далее, вы все равно несете затраты на измерение.

Важно понимать, с чьей стороны мы смотрим: со стороны фирмы и со стороны клиента. Это два разных взгляда на одну и ту же проблему.

И здесь возникает интересный момент: кто владеет информацией о том, что действительно нужно вашим клиентам?

Пример из жизни: парикмахерская и потеря знаний

Простой пример – поход к парикмахеру. Мужчины обычно консервативны и годами ходят в одно и то же место. Я уже пятнадцать лет хожу в одну и ту же парикмахерскую и каждый раз объясняю, что мне нужно. В последний раз я сказал, что мне нужно выглядеть прилично, потому что буду выступать в онлайне. Соответственно, достаточно привести в порядок только переднюю часть – сзади никто ничего не увидит. На корпоративы или другие события я тоже всегда уточняю, какой результат мне нужен, чтобы получить правильный сервис.

Мой мастер владеет этой информацией. Но здесь есть важный момент: на рынке с подобной информацией часто работают колл-центры, первая линия поддержки и другие подразделения, которые нередко состоят из самых низкооплачиваемых сотрудников. Иногда это даже не сотрудники вашей фирмы, а работники сторонних организаций. И информация о клиентах может реально теряться.

В примере с парикмахерской я на сто процентов уверен, что директор ничего не знает о том, почему я пятнадцать лет езжу из пригорода в город, чтобы меня там постригли. Они, скорее всего, считают своими клиентами тех, кто живет в радиусе пятисот метров пешком, хотя это далеко не так.

И да, стоит учитывать, что текучка персонала сильно влияет на сохранность таких знаний и часто приводит к их утрате.

Целевая аудитория и сегментация

Все это нужно для того, чтобы понимать, кто наша целевая аудитория. Она может быть разной, и ее потребности тоже различаются. Фреймворк помогает понять, как сегментировать эту аудиторию.

Мы можем оказывать сервис клиентам, которые вообще не являются нашей целевой аудиторией. Если задать вопрос «почему вы к нам приходите?», можно получить много информации и обнаружить, что реальные причины отличаются от того, что мы сами предполагали.

И нам нужно задуматься, соответствуем ли мы этим ожиданиям или нет.

Общие критерии качества и других аспектов

Дополнительно существуют общие критерии, к которым относится качество. В мире 1С у качества есть свои особенности: язык 1С не общего назначения, много лет продолжается дискуссия вокруг тестовых фреймворков и других инструментов. Я понимаю, что это достаточно чувствительная область.

Нам нужно понимать, насколько хорошо мы должны обеспечивать качество. У качества тоже есть свой порог: оно может быть недостаточным, а может быть и избыточным.

Есть критерии безопасности и критерии, связанные с регулятором – налогами, законодательством. Продукты 1С тесно завязаны на эти области, поэтому такие критерии встречаются часто.

И это далеко не все. Критериев гораздо больше.

Кроме этого, существуют критерии, связанные с опциональностью, удобством и доступностью. И моя любимая категория – критерии, связанные со временем. Здесь больше одного показателя: базовая длительность, предсказуемость и своевременность. Дальше я буду подробнее рассказывать про время.

Этот фреймворк дает возможность собрать информацию о клиентах, понять, как сегментировать целевую аудиторию и как выстраивать бизнес под этих клиентов.

Анализ метрик с сайта Infostart

Вернемся к метрикам, которые я обнаружил. Здесь сразу нужно задуматься, какие из этих метрик действительно нужны клиенту для выбора организации. Это не так очевидно: список большой, и в нем много разных показателей. Чтобы это понять, нужно понимать цель клиента.

Цели могут быть разными: где-то важно не опоздать, где-то – качество, где-то – удобство, где-то – соответствие нормам. Но у нас есть подсказка – матрица, которая помогает разложить метрики по смысловым группам.

Это мой пример. Прошу строго не критиковать: я раскидал показатели «на вскидку». Конечно, тема холиварная – можно запихнуть все в один квадрат и назвать клиентскими метриками, но тогда возникнет много вопросов.

Вы можете взять ваши собственные метрики и разложить их по этой матрице, чтобы задуматься, ради чего клиенты выбирают именно вас.

Я разложил метрики, исходя из своих предпочтений, и в критерий соответствия у меня попала только одна – местонахождение фирмы. Мне было важно, чтобы фирма находилась в Казахстане, потому что там есть специалисты, которые понимают контекст, налоговое законодательство и другие особенности. Но при этом я искал облачное решение, и фактически мог находиться где угодно, чтобы его выбрать.

Таким же образом можно разложить и другие метрики, и может оказаться, что в критериях соответствия не окажется ни одной. Я видел такие случаи – это довольно любопытно.

Пример из практики: очередь и дифференциация клиентов

Давайте подумаем, что происходит, когда клиентов много и можно не заморачиваться.

Я долго искал изображение стойки в аэропорту с очередями в бизнес-класс и эконом, чтобы показать контраст.

К чему эта картинка? Если у вас все хорошо и клиентов много, стоит задуматься, что некоторые клиенты не готовы ждать и готовы платить за иной уровень сервиса. В авиации эта проблема решается просто: есть клиенты, у которых есть деньги, и они готовы платить за возможность не стоять в очередях. Иногда такой сервис стоит минимум вдвое дороже. И это уже другая целевая аудитория.

Время как ключевой критерий

Самые популярные критерии соответствия почти всегда связаны со временем. Их, думаю, больше половины. На них нужно обращать особое внимание, потому что они напрямую связаны с гибкостью бизнеса.

Плакат «60 минут или бесплатно» – классический пример. В моем городе давно была акция «пицца за 45 минут или бесплатно», и люди, которые жили далеко от метро, очень любили эту акцию, потому что пиццу часто получали бесплатно. Это пример одного из критериев.

Время – универсальный критерий соответствия. Сюда входят длительность, своевременность и предсказуемость.

Время – это прекрасно, но важно понимать, что время – это не число. Время – это плотность распределения вероятности.

Пример из практики: когда я впервые приезжаю на новое рабочее место, я не знаю, сколько времени займет дорога. То же самое – когда впервые собираешь ребенка в школу или детский сад. Но со временем появляется статистика. Я, например, десять лет работал в одной компании и знал с точностью до десяти секунд, когда нужно выйти из дома, чтобы не опоздать.

Если у вас есть статистика, и она отображается в распределениях вроде тех, что на изображении, это даст вам подсказку о том, как вы работаете.

Природа работы и управление вариативностью

Есть и вторая сторона медали. Если вы понимаете, как распределяется время, вам нужно задуматься, что необходимо сделать, чтобы попадать в нужный диапазон, и что этому мешает. Мешает этому природа работы.

Я двадцать лет провел в разработке, связанной с 1С, и точно знаю: разработка программного обеспечения имеет высокую вариативность по времени. Делая два раза одно и то же, это может занимать разное количество времени. Это касается не только разработчиков, но и аналитиков – всех, чья работа относится к творческим профессиям. Вариативность заложена в саму природу такой деятельности.

Хотя Эйнштейн, судя по цитате, был бы с этим не согласен, но это факт.

И важно уметь управлять этой вариативностью.

Заключение

На что нужно обратить внимание?

Определить клиентскую метрику или хотя бы задуматься, почему клиенты выбирают именно вас.

Понять природу работы – помогает ли она вам попадать в нужную метрику или мешает.

Если вам важно время, научитесь им управлять. Инструментов достаточно много. Я, напомню, занимаюсь Kanban-методом, и он дает инструменты для работы с такими процессами.

Мы хотим сделать клиентов счастливыми, потому что нам это выгодно. Если клиенты довольны, они выбирают нас среди других компаний. Мы выигрываем в конкурентной борьбе, и это хорошо для бизнеса.

*************

Статья написана по итогам доклада (видео), прочитанного на конференции Анализ & Управление в ИТ-проектах.

+1 –

Вы можете заказать платную адаптацию этой статьи под ваши задачи на «Бирже заказов».

0% комиссии — оплата напрямую исполнителю;
Исполнители любого масштаба — от отдельных специалистов до команд под проект;
Прямой обмен контактами между заказчиком и исполнителем;
Безопасная сделка — при необходимости;
Рейтинги, кейсы и прозрачная система откликов.

См. также

Похожая задача - другой срок

Взгляд со стороны Заказчика Оценка проекта Россия Бесплатно (free)

Похожую доработку уже выполняли за 40 часов, поэтому заказчик ожидал такой же оценки во второй раз. Но первый специалист давно знал проект, а второму пришлось начинать с изучения чужого кода и накопленных изменений. Разберём, что на самом деле находится внутри прошлого срока.

27.07.2026 191 0 NikolayMaerov 1

Сложность, которой не видно

Взгляд со стороны Заказчика Бесплатно (free)

Почему заказчик не видит сложности. Эффект водопровода. Как показать воду вместо труб. Пять приёмов и антипример.

19.07.2026 569 0 evgen7938 3

Управление ожиданиями заказчика в 1С

Взгляд со стороны Заказчика Бесплатно (free)

Как управлять ожиданиями заказчика на 1С-проекте: фиксировать границы задачи, проговаривать ограничения, показывать риски, объяснять этапы, согласовывать критерии приемки и не обещать то, что потом превратится в аврал, конфликт или бесконечные доработки.

13.07.2026 264 0 YA_826532418 0

Почему команда кажется медленной

Взгляд со стороны Заказчика Руководитель проекта Россия Бесплатно (free)

Команда может активно работать, но для клиента по ощущением она тормозит, если он не видит статусов, следующего шага и понятного движения. Разбираю, как не доводить проект до ситуации, когда объяснения уже звучат как оправдания.

08.07.2026 356 0 NikolayMaerov 0

Оценили одно - просят другое: как говорить с заказчиком о переоценке сроков

Взгляд со стороны Заказчика Оценка проекта Бизнес-аналитик Руководитель проекта Россия Бесплатно (free)

Когда задачу еще уточняют, а срок уже требуют назвать, дата легко превращается в обещание на удачу. В статье разбираю, как говорить с заказчиком о сроках при плавающих вводных: что фиксировать, как объяснять переоценку без конфликта и почему старый срок не обязан выдерживать новую версию задачи.

07.07.2026 349 0 NikolayMaerov 5

Три типичных конфликта автоматизатора: где там win-win

Работа с требованиями Взгляд со стороны Заказчика Внедрение изменений Бесплатно (free)

Компромиссы в проектах автоматизации часто не решают конфликт, а лишь откладывают проблему и оставляют под угрозой потребности обеих сторон. На трех типичных ситуациях – споре с заказчиком об оценке, конфликте с разработчиком вокруг требований и сопротивлении пользователя новой версии – показываем, где участники на самом деле спорят не о действиях, а о неопределенности. Объясняем, как в теории ограничений работает инструмент «туча» и почему любая проблема в ТОС рассматривается как конфликт. Показываем, почему в возможность win-win-решения выгоднее верить и как такой подход помогает искать не компромисс, а более устойчивое решение.

02.07.2026 421 0 user2182327 0

Вопросы заказчику в 1С-проектах

Взгляд со стороны Заказчика Анализ потребностей и поиск решений Бесплатно (free)

Практическая статья о том, какие вопросы стоит задавать заказчику до разработки, настройки или изменения процесса в 1С, чтобы не переделывать решение через месяц после запуска.

23.06.2026 490 0 YA_826532418 0

Как защищать решение, когда заказчик хочет “как раньше”: практика 1С-проектов

Работа с требованиями Взгляд со стороны Заказчика Работа с заинтересованными сторонами Внедрение изменений Россия Бесплатно (free)

На 1С-проектах часто звучит фраза: “Сделайте как раньше, только в новой системе”. Обычно за ней скрываются страх изменений, привычки пользователей, неописанные процессы и желание перенести старый хаос в новую 1С. Разбираем, как аналитику и руководителю проекта защищать решение без конфликта, давления и бесконечных переделок.

15.06.2026 456 0 YA_826532418 4

Комментарии

Подписаться на ответы Инфостарт бот

Свернуть все

1. ksnik 703 07.05.26 13:21 Сейчас в теме

Полезно измерять то, что реально важно для клиента (время до решения), а не то, что легко посчитать. Время — действительно главный критерий. В нашем LirAgent время = количество итераций до успеха. Чем меньше итераций нужно агенту, чтобы найти корневую причину, тем ценнее система. Это и есть память выживания: не просто запомнить успешный паттерн, а запомнить самый короткий путь к решению. Принудительная экспертиза «да/нет/отмена» — это механизм, который:
Сокращает количество итераций (человек сразу останавливает неверный путь)
Закрепляет правильные паттерны (три «да» → навык)
Отсекает бесполезные траектории («нет» с комментарием → антипример в память)
Мы пока не измеряем количество итераций до корня. Я предлагаю добавить этот механизм.
Без экспертизы агент может блуждать десятки шагов. С экспертизой — человек отсекает ложные ветви за секунду.
Мы должны измерять не просто «найдена ли причина», а за сколько итераций. И наша задача — минимизировать это время через обучение на успешных траекториях и блокировку неудачных.

Как измерять количество итераций до корня проблемы

Простой способ (без изменения архитектуры):
В каждой сессии с агентом логируем:

session_id, start_time, end_time, iterations_count — сколько раз агент вызывал инструменты (запросы к 1С, Prolog, поиск по коду) до формулировки окончательного диагноза
human_interventions — сколько раз пользователь нажимал «нет» или «отмена» (экспертиза)
final_result — «успех» или «неуспех» (подтверждено человеком)
Более точный способ (с трекингом пути):
Записываем не только количество, а всю траекторию:
Шаг 1: какой инструмент вызвал, какой ответ получил
Шаг 2: ...
Шаг N: финальный диагноз
Потом можно анализировать:
Какие последовательности шагов ведут к успеху быстрее всего?
На каком шаге чаще всего человек нажимает «нет» (слабое место агента)?
Какие типы проблем требуют больше итераций?
Что даст этот замер:
Оценка эффективности — улучшаем агента, смотрим, падает ли среднее число итераций.
Обучение памяти выживания — успешные короткие траектории сохраняем как «скиллы», длинные — разбираем, где узкое место.
Приоритизация улучшений — если больше всего «нет» на шаге с запросом к регистру, значит, агент плохо формулирует условия.
Практическая реализация (минимальная):
Добавить в оркестратор счётчик итераций и логировать в SQLite:

sql
CREATE TABLE sessions (
id TEXT PRIMARY KEY,
start_time TEXT,
end_time TEXT,
iterations INTEGER,
human_no_count INTEGER,
success BOOLEAN
);
После каждого успешного завершения сессии — запись. Потом простой отчёт: среднее число итераций за неделю, тренд.

Индикаторы здоровья — это фоновые метрики, которые показывают «пульс» системы. По отдельному значению трудно сделать вывод, но их отклонение от нормы сигнализирует о проблеме.

Для LirAgent такими индикаторами могут быть:
Индикатор Что измеряет Когда бить тревогу
Средняя длина сессии Количество итераций до завершения Резкий рост → агент начал блуждать
Процент успешных сессий Доля случаев, где final_result = успех Падение ниже порога → деградация качества
Частота «отмена» Сколько раз пользователь выбирал «отмена» Рост → неоднозначные ситуации, агент не может предложить варианты
Среднее время ответа инструмента Задержки при вызовах к 1С, Prolog, поиску Рост → проблемы с инфраструктурой
Количество уникальных ошибок Разнообразие типов сбоев Рост → новая проблемная область
Как использовать:

Это не цели, а сигналы чтобы заметить деградацию агента до того, как пользователь начнёт жаловаться.

Мониторить на графике, следить за трендами
При выходе за границы — запускать детальный анализ траекторий
Пример порогов:
Индикатор Зелёная зона Жёлтая зона Красная зона
Итераций до успеха 1–3 4–6 >6
Успешных сессий >80% 60–80% <60%
Частота «отмена» <5% 5–15% >15%

2. ksnik 703 07.05.26 14:59 Сейчас в теме

Логирование траекторий, поиск кратчайшего пути, блокировка тупиков не просто имеют аналоги — они лежат в русле самых актуальных исследований. Пройдемся по ключевым находкам и оценим их полезность для LirAgent.

1. Принудительная экспертиза и борьба с рационализацией (Agent Skills)
Что нашли: Проект Agent Skills (27K звезд на GitHub) напрямую решает проблему, с которой мы боремся . Автор утверждает, что LLM по умолчанию ищут «кратчайший путь к готово» и виртуозно рационализируют пропуск важных шагов («эта задача слишком проста для спецификации»).

Что там есть: Чтобы победить это, в каждый скилл встроены таблицы анти-рационализации — готовые опровержения оправданий, которые агент еще не успел придумать. Например, на тезис «я напишу тесты позже» дается жесткий ответ: «"Позже" — ключевое слово. Позже не наступает. Напиши падающий тест первым». Процесс важнее прозы: скиллы — это не «пособия по лучшим практикам» (эссе, которое агент прочитает и проигнорирует), а последовательности действий с контрольными точками и критериями выхода.

Насколько подходит? 🔥 Идеально. Твоя принудительная экспертиза «да/нет/отмена» и концепция антипримера — это ручная версия таблицы анти-рационализации. Agent Skills предлагает готовую инфраструктуру и фреймворк для внедрения. Я настоятельно рекомендую взять этот проект как референсную архитектуру.

2. Концепция «Тупиков» (Dead-End Discovery) и безопасного исследования
Что нашли: Как минимум две работы напрямую исследуют то, что ты назвал AntiPathBlocker.

LLM для обнаружения тупиков: Ученые используют LLM для обнаружения состояний, из которых достижение цели невозможно .

Систематическая корректировка языковых моделей: Исследователи предлагают формальный метод (основанный на теории тупиков из RL) для того, чтобы на каждом шаге отговаривать модель от выбора токенов, которые с высокой вероятностью приведут к нежелательному результату (тупику) .

Насколько подходит? 🚀 Прорывная параллель. Ты пришел к той же идее, что и передовые исследовательские группы. Эти работы формализуют твою интуицию. Это мощное подтверждение правильности курса — подход LirAgent находится на передовом крае науки.

3. Адаптивная маршрутизация и смесь экспертов (Adaptive Router)
Что нашли: LLM Adaptive Router и LiteLLM Adaptive Router динамически определяют, какой инструмент/модель использовать для запроса, на основе его типа и истории успехов .

Что там есть: LiteLLM — продвинутый адаптивный роутер с обратной связью (например, фраза «отлично, сработало» — это сигнал успеха). Он классифицирует запросы по семи типам (например, analytical_reasoning, code_generation) и отслеживает, какая модель лучше справляется с каждым из них.

Насколько подходит? 🔥 Железобетонное подтверждение. Это почти один в один твой AdaptiveRouter, но еще и с возможностью балансировки качества и скорости/стоимости. LiteLLM — это production-решение, которое можно интегрировать.

4. Экономия итераций: Гибридный A* + LLM
Что нашли: Концепция Prison Break AI и SmaLLaMA-A: LLM используется для стратегического планирования (один раз), а детерминированный алгоритм A — для тактического поиска пути в реальном времени .

Насколько подходит? 🟡 Косвенно. Хотя это не про LLM-агентов, здесь заложен общий принцип: большая умная модель используется для одинокого «тяжелого» планирования, а легковесный детерминированный алгоритм — для быстрых повторяющихся действий. Для нас это означает: одну сложную диагностическую задачу решаем через LLM (один раз), а потом используем найденный короткий путь (скилл) многократно.

5. Метрики эффективности (Cost-to-Convergence)
Что нашли: Aider AI обсуждают, что текущие бенчмарки несправедливы к агентам, так как дают лишь 1-2 попытки. Они хотят измерять cost-to-converge (или итерации до сходимости) — количество попыток и ресурсов, необходимых для достижения стабильного результата .

Насколько подходит? 🔥 Точное попадание. Это ровно твоя идея измерения количества итераций до успеха, а не просто факта успеха. Они подтверждают, что измерять нужно именно процесс, а не одно состояние.

Для отправки сообщения требуется регистрация/авторизация

Автор:

Артемов Сергей (svartemov)

Рейтинг: 1

Вы можете заказать платную консультацию или разработку у автора. Будет создан приватный заказ на «Бирже заказов» для автора.

Публикация:

№ 2686769

Создание 07.05.26 12:16

Обновление 07.05.26 12:16

Статистика:

Просмотры 666

Загрузки 0

Рейтинг 1

Комментарии 2

Характеристики:

Код открыт Да

Рубрики Канбан и поставка ценности ,
Взгляд со стороны Заказчика

Кому Для всех

Тип файла Нет файла

Платформа Не имеет значения

Конфигурация Универсальные

Операционная система Не имеет значения

Страна Не имеет значения

Отрасль Не имеет значения

Налоги Не имеет значения

Вид учета Не имеет значения

Доступ к файлу Бесплатно (free)

Метрики тщеславия. Как понять, какие метрики вам не нужны?

Личный пример: провал в клиентском сервисе

Анализ предложенных метрик выбора партнера

Разрыв между измерениями компании и критериями выбора клиента

Три компонента продукта: дизайн, реализация, поставка

Четыре группы метрик

Критерии соответствия

Индикаторы здоровья

Метрики улучшений

Метрики тщеславия

Приоритизация метрик

Стоимость измерений и разные точки зрения

Пример из жизни: парикмахерская и потеря знаний

Целевая аудитория и сегментация

Общие критерии качества и других аспектов

Анализ метрик с сайта Infostart

Пример из практики: очередь и дифференциация клиентов

Время как ключевой критерий

Природа работы и управление вариативностью

Заключение

См. также

Журнал

База знаний

Лаборатория

Анализ & Управление

Сопровождение 1С

Корпоративные решения

Обучение

Маркетплейс

Проектный офис

Мероприятия

Видеозаписи

Биржа заказов

Форум

Мерч

О компании