Стратегия для человека, монотонная работа для машины
Управление ИТ-системами часто связано с монотонными и утомительными задачами. Работа становится все более трудоемкой по мере увеличения количества серверов и конечных точек пользователей. Ситуацию усугубляет виртуализация устройств использованием облачных платформ. Но готов ли ИТ-сектор к автоматизации монотонного труда? Этот вопрос и способы улучшить ситуацию рассматривает в своей статье аналитик Боб Тарзи.
Он отмечает, как именно традиционные поставщики ПО, такие как BMC, IBM и Microsoft, адаптируют инструменты автоматизации. Они включают в свои продукты дополнения, которые структурируют информацию о сети: состав «железа», установленное ПО, журналы событий, инвентаризация сетевого оборудования, вплоть до расхода картриджей в сетевых принтерах.
Принципиально другой подход используют молодые компании. В IPsoft заявляют о 35%-ной автоматизации действий клиента сразу после внедрения. Это достигается путем машинного обучения и анализа истории логов. Показатель со временем доходит до 70-80%.
Для эффективной автоматизации требуются две составляющие: хорошо документированные рабочие процедуры и всестороннее понимание ИТ-инфраструктуры, которые фиксируются с помощью современной базы данных управления конфигурацией (CMDB). Чем ниже качество каждого из этих факторов, тем больше потребуется усилий для автоматизации. Моделировать и документировать инфраструктуру могут инструменты из комплекта управления системами. На динамическом моделировании ИТ-инфраструктуры специализируются компании RedSeal, SolarWinds и Ipswitch.
Потенциальной проблемой может стать вопрос безопасности. ПО, задействованное в автоматизации типовых задач, требует повышенных административных привилегий. Этим могут воспользоваться хакеры, чтобы внедрить собственные скрипты в автоматические процессы управления инфраструктурой.
Обнаружение проблем
Ранние оповещения об инцидентах снижают их последствия и сокращают сроки восстановления. Стандартный способ выявления проблемы – дождаться, когда о ней сообщат сами пользователи. Часто проблемы специфичны для каждого пользователя, скажем запрос доступа или сброс пароля. В иных случаях отчет говорит о серьезной проблеме, которая затронет всю систему, если ее не решить.
Взаимодействие с пользователями обычно происходит через службы ИТ-поддержки: большинство их них теперь поддерживают автоматизацию. Но автоматизация может идти дальше и обнаруживать проблемы, прежде чем пользователи узнают о них. Устройства постоянно генерируют логи, которые записываются в файлы журналов. Большая часть этой информации представляет собой бессмысленный цифровой шум, но некоторое ПО уже использует инструменты его анализа для выявления проблем и своевременного реагирования.
Когда возникающая проблема распознается, требуется действие: запрос на изменение – тикет, зарегистрированный в системе управления. На этом этапе много возможностей внедрения ИИ с помощью автоматической классификации, назначения, определения приоритетов и маршрутизации инцидентов.
Разрешение инцидентов
Администраторам часто требуется доступ к нескольким устройствам и/или системам для устранения проблемы. Интеллектуальные инструменты могут самостоятельно запускать скрипты, созданные с использованием языков конфигурации, таких как Puppet, Ansible или Chef. Эти инструменты с открытым исходным кодом развиваются самостоятельно. Например, Puppet может автоматизировать различные этапы управления системами, включая подготовку, настройку и исправление.
Osirium осуществляет доступ к устройствам и системам без администраторов. Этот навык реализуется с помощью автоматизации роботизированного процесса и языка задач, либо путем поддержки продуктов других поставщиков. Принцип используется для изменений большого объема, например, для обновления мобильных устройств, где существует необходимость в изменении сотни параметров на тысячах устройств.
Закрытие цикла
Как только проблема решена, анализ причин (RCA) дает представление о том, почему возникла проблема, и как предотвратить повторение. Недавний отчет Splunk показал, что более 13% инцидентов происходят из-за неспособности учиться через RCA из предыдущих инцидентов.
В отличие от людей, ИИ не забывают о том, как были устранены предыдущие проблемы, с готовностью вспоминая использованные для их решения процедуры. Все действия отслеживаются и регистрируются: искусственный интеллект анализирует их, повторно исправляет и совершенствует процесс.
Плоды прогресса
Человек не может вручную обрабатывать огромные объемы данных, которые создают ИТ-системы и используют программы управления. Это открывает потенциал для управления машинным обучением. Ведь автоматизация призвана сделать монотонную работу эффективной и не такой утомительной. Но, несмотря на автоматизацию некоторых процессов, потребность в квалифицированных операторах ИТ-управления остается.
Кроме того, автоматизация управления необходима для поддержки масштабов ИТ-операций. Неважно, совершают их виртуальные сервера или тысячи пользовательских смартфонов.
Напомним, что отечественные разработчики активно развивают платформы, призванные автоматизировать типичные процессы и облегчить жизнь пользователям, а самым популярным решением для автоматизации предприятий остается платформа «1С».