магистрант НГТУ
филиал ЗАО «Энвижн Груп» Энвижн-Сибирь»
инженер-стажер
Юн. С. Г., к.т.н., доцент; Новокрещенов Н. С., руководительль направления систем хранения и обработки данных
УДК 004.032
В настоящее время ИТ-ресурсы становятся все более доступными. По мере падения стоимости ИТ-ресурсов все большее число предприятий получает к ним доступ. Внедрение виртуализации и развитие концепции облачных вычислений меняет облик типичного центра обработки данных. Вместе с тем статическая ИТ инфраструктура заменяется динамическими решениями на базе виртуальных систем. Это позволяет не только оперативно реагировать на возрастающие запросы бизнеса, но и уменьшает стоимость обслуживания информационных систем. Всё большую популярность завоёвывает концепция облачных вычислений, согласно которой инфраструктура, платформа, программное обеспечение — легко предоставляемые услуги. Данный подход позволяет пользователям не задумываться о вопросах обеспечения работоспособности физического оборудования и установки ПО, а использовать ИТ технологии исключительно как инструмент для решения собственных задач. Не удивительно, что при этом предъявляются самые высокие требования к отказоустойчивости систем.
В такой ситуации большое значение приобретает задача реализации процесса эффективного комплексного мониторинга ИТ инфраструктуры предприятия и отдельных её составляющих. Данная задача не может быть решена без четкого понимания возможностей существующих систем мониторинга для применения в различных видах ИТ инфраструктур и их составляющих [3]. Анализ отечественных и зарубежных источников показал, что устоявшейся классификации систем мониторинга, отвечающей поставленной задаче нет. Здесь предлагается один из подходов, который возможно применить.
Предлагается классифицировать данные системы по области применения (рисунок 1):
В этот же класс можно отнести мониторинг локальной вычислительной сети на физическом уровне.
Рисунок 1 – Классификация систем мониторинга ИТ инфраструктуры по области применения
Подобный мониторинг позволяет вовремя обнаружить нештатную ситуацию и оперативно принять меры по ликвидации последствий.
Позволяет обеспечить контроль работы приложений и сервисов, таких как веб-портал, СУБД, почтовая система и др.; оценка времени отклика сервиса и получить информацию о неполадках до того, как о них сообщат недовольные пользователи. Комплексные транзакции активно используются для мониторинга баз данных, веб приложений, систем доставки почты.
Подсистема управления событиями — одна из основных компонент мониторинга IT инфраструктуры. От грамотной систематизации событий зависит скорость реакции администраторов на возникающие неполадки. Одним из ключевых характеристик системы мониторинга является возможность локализации события, определения точного места возникновения отказа. При этом необходимо учитывать и взаимосвязи между компонентами архитектуры. При классификации событий системы мониторинга используют информацию о топологии сети и связях между различными объектами.
Обслуживание крупных дата центров множеством специалистов, с разграничением ответственности только за свою часть инфраструктуры приводит к необходимости использования различных механизмов разграничения доступа. Зачастую системы мониторинга могут интегрироваться с базами Active Directory и LDAP. Разумеется, система управления событиями должна предусматривать возможность гибкой настройки уведомлений о событиях для различных пользователей.
Использование множества утилит для мониторинга отдельных компонентов информационной системы уже не достаточно для надежного контроля состояния сервисов и оборудования. Конечно, описанный выше функционал можно обеспечить при помощи нескольких различных систем, но обеспечить эффективную взаимосвязь компонентов и корректную обработку событий при таком подходе практически невозможно. Современные решения для мониторинга обеспечивают единый интерфейс для контроля за всеми компонентами инфраструктуры. В последнее время отдельным преимуществом является возможность работы в гетерогенных сетях и обеспечение полноценного контроля за Linux и Windows системами.
Для осуществления комплексного мониторинга инфраструктуры многие системы используют различные методы сбора информации. Зачастую для осуществления контроля за устройствами и сервисами необходима установка дополнительного клиентского ПО. Данный подход может затруднить развертывание системы мониторинга, ведь на установку и настройку клиентов требуется дополнительное время. Иной подход предусматривает сбор информации при помощи стандартных сетевых средств, такие как SMNP, SSH, IPMI протоколы для Unix подобных систем и WMI, SNMP для Windows систем. Данное решение значительно упрощает развертывание мониторинга, кроме того не возникает никаких проблем при работе в гетерогенных сетях. Использование стандартных протоколов, существенно расширяет спектр контролируемых устройств.
Обеспечение возможности использования единого интерфейса для контроля как за физической так и за виртуальной составляющей инфраструктуры является одной из обязательных функций современной системы мониторинга. Многие системы используют родной API для сбора информации о виртуальных системах и позволяют контролировать использование ресурсов памяти и CPU, состояние хранилищ, производительность виртуальных машин и процессы миграции машин между физическими хостами. При этом могут поддерживаются различные системы виртуализации: KVM, Vmware, XEN. Единый мониторинг физической и виртуальной среды становиться особенно актуальным в связи с увеличением популярности концепции облачных вычислений. Гибкая система контроля за состоянием вычислительного облака является необходимым условием для обеспечения высокого уровня отказоустойчивости.
Зачастую мониторинг разворачивается в уже работающей инфраструктуре [3, 4], и поэтому большое значение имеют возможности автоматического определения сетевой топологии, систем и работающих сервисов. Подобные технологии позволяют существенно сократить время на развертывание и настройку системы мониторинга и в дальнейшем упрощают добавление новых устройств и даже целых сегментов сети. Большое значение имеют также и встроенные возможности системы по классификации устройств. После того, как обнаруженные устройства распределены по группам (Linux машины, Windows машины, маршрутизаторы, сервисы и т.д.) становиться возможным унифицировать сценарии мониторинга схожих устройств благодаря многочисленным шаблонам, которые в том или ином виде присутствуют во всех современных системах мониторинга.
При расширении IT-инфраструктуры один сервер может не справиться со сбором и анализом всей поступающей информации [2], поэтому существуют различные сценарии масштабирования системы мониторинга. Одним из типичных решений является создание множества серверов сбора данных, расположенных в различных сегментах инфраструктуры. При этом задача анализа данных и отображения отчетов возлагается на один центральный сервер. В случае сложной территориально распределенной инфраструктуры возможно создание иерархической схемы мониторинга. Такой подход позволяет объединить несколько систем мониторинга в единую структуру с возможностью централизованного контроля и получения отчетов о состоянии инфраструктуры на любом уровне.
Полностью универсального рецепта для построения эффективного мониторинга не существует, поэтому различные системы предусматривают широкий спектр настроек и возможность расширения дополнительными модулями. Во многом благодаря этому адекватное сравнение промышленных решений мониторинга является весьма трудной задачей. Основной функционал большинства систем схож, а оценки реальной эффективности можно проводить, только отталкиваясь от конкретной инфраструктуры и её особенностей. Представляется, что предложенная выше классификация систем мониторинга ИТ инфраструктур станет основой разрабатываемых в рамках магистерского исследования процедур принятия решений по выбору систем мониторинга на основании имеющейся на предприятии ИТ инфраструктуры и предъявляемых к ней требований.
Рецензии:
27.11.2013, 20:53 Назарова Ольга Петровна
Рецензия: рекомендуется к печати.
28.11.2013, 2:24 Назарова Ольга Петровна
Рецензия: Убрать подзаголовки, привести статью к форме, согласно требованиям. Доработать по оформлению, сделать сноски на источники. не рекомендуется к печати.