вторник, 3 февраля 2009 г.

Зачем нужны системы класса Performance Management на примере CA eHealth

Эффективное управление современными корпоративными сетями — очень и очень непростая задача. Не последнюю роль играет экспоненциально растущая сложность ИТ инфраструктуры и растущая такими же темпами разнообразная отчетность. Разнообразные инструменты управления в прямом смысле этого слова заваливают администраторов и аналитиков массивами разнообразных данных. Из-за отличий в форматах данных и отсутствия корреляции отчетов, ИТ-специалисты большую часть времени тратят на обработку ошибочных аварийных сообщений и расследования тупиковых сценариев развития вместо проработки стратегических инициатив.
Благодаря проактивному анализу в реальном времени, в ходе которого данные извлекаются из разных источников и преобразуются в рабочую информацию, eHealth унифицирует и автоматизирует управление мультивендорной ИТ инфраструктурой, построенной с использованием широкого спектра технологий.

1. ВВЕДЕНИЕ

В эпоху Интернета бизнес все больше зависит от работы сети. Приложения всегда должны быть доступны и должны работать с приемлемым для внутренних и внешних пользователей уровнем производительности. Цена простоев растет и сегодня, по данным исследований, отказы сети обходятся крупным предприятиям в среднем в 60 000 долларов в час.
Проблему дополнительно усложняют бюджетные ограничения, из-за которых отделам ИТ, изо всех сил пытающимся привести в порядок мультивендорные сетевые среды, построенные на технологиях различных поколений, приходится выполнять большее количество задач меньшим количеством ресурсов, что создает дополнительные сложности. ИТ-команды, использующие разрозненные инструменты для управления различными системами и сетевыми элементами по отдельности, получают уйму избыточных и несогласованных данных и ошибочные аварийные сообщения.
Фактически, отраслевые исследования показали, что при использовании типичных методов работы отдела ИТ, сотрудники тратят более 80% рабочего времени на поиски причин проблем с сетью. Неэффективно используемое время можно и нужно сократить путем внедрения проактивной системы управления производительностью сети, которая создаст единое представление всей гетерогенной сетевой инфраструктуры и обеспечит централизованное управление.
2. CA EHEALTH
На сегодняшний день, продукт CA eHealth является одной из лучших платформ для управления производительностью информационно-вычислительных систем. CA eHealth может быть использован как в относительно небольших сетях, так и в крупных, включающих распределенные приложения, базы данных, серверные фермы, арендованные и собственные каналы передачи данных. При этом верхний предел размеров сети не ограничен. Модульность решения позволяет оптимальным образом выбирать конфигурацию решения под требования каждого заказчика. Опираясь на опыт многочисленных внедрений, поставщик предлагает 3 базовых предопределенных комплектации продукта CA eHealth, предназначенных для решения задач разного объема и масштаба:
• eHealth Foundation — для решения узкоспециализированных систем управления производительностью уровня предприятия
• eHealth Standard — для управления производительностью сложных программно-аппаратных комплексов или территориально-распределенных информационных систем
• eHealth Premium — для использования в сетях крупных операторов услуг.

2.1. Основные возможности CA eHealth

Семейство продуктов CA eHealth интегрирует управление производительностью самых сложных мультивендорных сетей с несколькими технологиями, сводит воедино данные из нескольких источников и отображает их в виде единого, персонализированного бизнес-представления. Больше половины проблем с деградацией и простоями сети связано с серьезными отказами и CA eHealth не только управляет отказами, но и справляется с оставшейся половиной проблем.
CA eHealth накапливает в ретроспективной базе данных сведения о событиях и использует этот архив для анализа тенденций и обнаружения проблем до того, как они отразятся на пользователях и бизнес-процессах. Это позволяет находить узкие места различных сетевых элементов и соединений, а также документировать потребности в дополнительных мощностях. И напротив, можно найти и оптимизировать недостаточно используемые ресурсы.
В CA eHealth есть функция т.н. гранулярного управления качеством услуг, предназначенная для настройки различных классов услуг и назначения им целей, основных пороговых значений и других показателей производительности. Отчеты об уровне предоставляемых услуг демонстрируют достигнутое качество услуг (QoS) и выполнение сервис-провайдером внешних соглашений SLA.
Различного вида отчеты Top N, Trend, At-A-Glance, MyHealth, Health, Service Level, End-To-End PVC, QoS analysis в программе настроены специально под ключевых пользователей системы, например руководство, IT менеджеры, пользователи услуг и т.д.
Мощная система визуализации графических отчетов дает богатые возможности по настройке для специализированных задач оператора, в то же время сохраняется максимальное удобство в восприятии и чтении информации.
Использование в системе Long-Term Trending позволяет проводить анализ тенденций роста загруженности сетевых элементов и IT-ресурсов.
Расчет нормативных характеристик сетевой активности происходит в первую неделю функционирования системы после запуска, затем обеспечивается быстрое выявление исключительных и нестандартных событий в работе всей контролируемой части сети оператора.
Система так же обладает механизмами по анализу планирования пропускной способности сети с поддержкой метода “What if …” для упрощения принятия решения при развитии сети.

Интеграция CA eHealth с приложением управления неисправностями — Fault Management (CA Spectrum) даст возможность, быстро и правильно определить проблему на сети оператора еще до того момента, как конечный пользователь ощутит снижение качества предоставляемой услуги/сервиса. Внешний вид пользовательского интерфейса CA eHealth E2E Console показан на рисунках ниже.


2.1.1. Проактивное управление доступностью услуг
Если инструменты мониторинга и управления сетью ежедневно генерируют сотни аварийных сообщений, бывает сложно отличить истинные проблемы от индуцированных. CA eHealth проактивно отслеживает ситуацию и в режиме реального времени отправляет аварийные сообщения о нарушении порогов, давая сотрудникам служб поддержки возможность принять меры прежде, чем снизится уровень обслуживания (SLA).
Кроме того, CA eHealth предварительно обрабатывает аварийные сообщения о производительности с помощью встроенных функций аналитики, мощных алгоритмов и собственных возможностей дедупликации. Таким образом, помехи, создающие ложные или дублирующиеся аварийные события, эффективно устраняются, а приоритеты в задачах управления расставляются на основе бизнес значимости событий.
Проактивная аналитика eHealth строится на базе двух ключевых алгоритмов, позволяющих анализировать нештатные ситуации в ретроспективном контексте.

ВРЕМЯ ЗА ПРЕДЕЛАМИ ПОРОГОВОГО ЗНАЧЕНИЯ. Использования этого алгоритма контроля параметров приводит к тому, что CA eHealth при каждом цикле опроса сравнивает значение переменной с заданным пороговым значением и формирует аварийное сообщение, если ее значение «слишком сильно и слишком долго отклоняется от нормы». Вместо того, чтобы формировать для системы fault management аварийное сообщение (trap) при каждом нарушении за пределы порогового значения, система учитывает длительность такого нарушения и учитывает только реально существующие проблемы.



ОТКЛОНЕНИЕ ОТ НОРМЫ. Использование этого алгоритма позволяет CA eHealth определять общую базовую производительность сетевой инфраструктуры. Впоследствии, вместо того, чтобы сравнивать текущую производительность с неким заранее определенным пороговым значением, CA eHealth определяет границы нормальных значений указанного параметра с учетом конкретного дня и времени на основе ретроспективных данных и проверяет, не отклоняется ли текущее поведение от спрогнозированной нормы.


 
Использование этих эффективных алгоритмов и предустановленных правил позволяет CA eHealth автоматически определять базовые параметры сети и обнаруживать деградацию производительности уже через несколько часов после установки системы. Фоновое тестирование доступности услуг помогает обеспечить доступность и приемлемое время отклика контуров сети, портов маршрутизаторов и важнейших сетевых служб.
2.1.2. Сложная комплексная отчетность о производительности
Сложная отчетность о производительности – ключевой элемент семейства продуктов CA eHealth. На основе сочетания ретроспективных и текущих показателей, а также интеллектуального анализа, CA eHealth формирует персонализированные представления, позволяющие быстро обнаружить и устранить деградацию производительности еще до того, как она отразится на качестве обслуживания.
НАГЛЯДНЫЕ ОТЧЕТЫ. Специализированные наглядные отчеты дают полное представление о доступности и производительности конкретного элемента, отображая основную статистику на заданном интервале времени. Отчеты, автоматически собирающие и единообразно представляющие данные о производительности, существенно сокращают временные затраты на устранение проблем.
ОТЧЕТЫ TOP N. Табличный отчет Top N отсортировывает элементы, отвечающие некоторым критериям, выбранным пользователем. Например, с помощью таких отчетов можно найти сегменты сети, которые работают лучше или хуже всего, быстрее или менее всего, а также те, которые меньше всего используются. Пользователь может запланировать автоматический запуск отчетов Top N через определенные промежутки времени. Это даст дополнительный полезный специализированный инструмент.
ОТЧЕТЫ О ТЕНДЕНЦИЯХ. CA eHealth формирует отчеты о тенденциях, в которых прослеживается значение одной или нескольких переменных производительности за определенный промежуток времени. Благодаря гибкости этих отчетов их можно использовать для создания профилей потребления трафика по времени и для определения связей между элементами и переменными. В частности, можно отслеживать такие компоненты системы, как центральные процессоры, диски, сети LAN и WAN, процессы и наборы процессов, а также и пользовательские и системные разделы.
ОТЧЕТЫ О ПЛАНИРОВАНИИ МОЩНОСТЕЙ. Отчеты о планировании мощностей eHealth используются при анализе поведения сетевых ресурсов в разных ситуациях и прогнозировании места и времени добавления мощностей.
• Отчеты о мощностях «What-If» (что, если). Запуск сценариев для возможных в будущем состояний по алгоритму «что, если» позволяет заранее подготовиться к возникновению проблем.
• Отчеты для оценки будущих требований к мощностям. Эти отчеты содержат прогнозы относительно того, как в будущем могут измениться требования к мощностям по конкретной переменной (например, по использованию раздела).
• Отчеты о распределении мощностей. Эти отчеты позволяют сравнить запроектированные мощности с пороговым значением модернизации, найти элементы, которые, согласно прогнозу, выйдут за этот порог, и определить количество дней до необходимой модернизации.
ОТЧЕТЫ MYHEALTH. Отображаемые в Web-интерфейсе eHealth, отчеты MyHealth настраиваются в соответствии с потребностями отдельных пользователей. В частности, это может быть один или несколько настраиваемых отчетов о наиболее важных для работы конкретного пользователя элементах и группах.
ОТЧЕТЫ О СОСТОЯНИИ СИСТЕМЫ. В этих отчетах состояние группы элементов оценивается методом сравнения текущей и ретроспективой производительности за день, неделю или месяц. В них приводится список требующих внимания ситуаций, а также найденные ошибки, необычные объемы или изменения объемов использования, которые необходимо исследовать. 
ОТЧЕТЫ ОБ УРОВНЕ ПРЕДОСТАВЛЯЕМЫХ УСЛУГ. Эти отчеты демонстрируют общее качество обслуживания (QoS) в разных классах и документируют выполнение внутренних и внешних соглашений SLA. Их можно адаптировать к конкретной ситуации, указав целевой уровень обслуживания, основные пороговые значения и другие показатели производительности. Помимо отчетов уровня предприятия, существуют представления, специально предназначенные для ответственных работников, ИТ-менеджеров и потребителей услуг.
ОТЧЕТЫ ОБ АНАЛИЗЕ ТРАФИКА. Возможности анализа трафика позволяют отслеживать трафик маршрутизаторов Cisco NetFlow и стандартных RMON2-зондов. По этим отчетам видно, кто занимает определенные соединения и какие используются протоколы и приложения. Это механизм позволяет видеть количество сетевых ресурсов, потребляемых пользователями, подразделениями, регионами или приложениями, а также определять расходы по каждому отделу.
РАСПРЕДЕЛЕННАЯ ОТЧЕТНОСТЬ. Распределив приложения CA eHealth по нескольким системам внутри кластера серверов или в разных географических регионах, можно будет из единого представления управлять более, чем одним миллионом устройств. Компьютеры могут находиться за корпоративным сетевым экраном или снаружи. Поддерживается одновременная работа нескольких операторов.
2.1.3. Стратегическое планирование мощностей на основе прогнозов
CA eHealth через заданные промежутки времени собирает и сохраняет жизненно важную информацию о сетевой среде. Готовые и настраиваемые отчеты, использующие эту обширную базу ретроспективных данных, помогают анализировать тенденции, находить доступные и избыточно или недостаточно задействованные основные ресурсы и выбирать разумные меры по планированию мощностей.
ПРАВИЛЬНОЕ МАСШТАБИРОВАНИЕ ИНФРАСТРУКТУРЫ. В отчетах о планировании мощностей идентифицируются профили потребления сетевого трафика, тенденции и зоны активного использования ресурсов. Это позволяет принимать проактивные обоснованные решения по поводу того, где необходимо модернизировать, урезать или заблокировать мощности. В итоге создается правильно масштабированная инфраструктура, обеспечивающая максимальную производительность по минимальной цене.
АНАЛИЗ И ОТЧЕТНОСТЬ “WHAT-IF”. Алгоритм анализа и отчетности «что, если» позволяет понять влияние роста системы на доступные сетевые ресурсы. Имея сведения, необходимые для правильного выбора момента инвестиций, можно сэкономить деньги и извлечь больше пользы из имеющихся ресурсов.
 
Рис. 1 Отчеты о тенденциях дают сведения, которые очень важны для планирования мощностей. Они могут легко настраиваться на отображение нужной информации. В настоящем отчете показано изменение средней дневной загрузки процессора в течение недели
2.2. Программный модуль CA eHealth E2E Console
Основообразующий блок системы CA eHealth. Обеспечивает сбор и анализ статистических данных со всего сетевого оборудования и IT инфраструктуры оператора. 
Поддерживается самостоятельное обнаружение новых устройств (или интеграция с CA Spectrum) и ресурсов, их непрерывный опрос, агрегация данных из SNMP-агентов в базу данных, поддержка интерфейса оператора (GUI/WEB), и составление отчетов являются основными функциями CA eHealth E2E Console.
2.3. Программный модуль CA eHealth Live Health
Программный модуль, который обеспечивает в реальном масштабе времени взаимодействие с любыми компонентами системы CA eHealth. Полностью интегрируясь с ними, модуль дает возможность отслеживать все контролируемые ресурсы, и своевременно делать уведомления о проблемах в другие системы OSS (Fault management).
Модуль eHealth Live Health включает три компонента:
Live Status – визуализация текущего состояния IT-инфраструктуры. На высокоуровневой диаграмме отображается текущее состояние аварийных сообщений ключевых элементов сети по результатам фонового анализа поступающих данных о временной динамике производительности. Эта единая консоль аварийных сообщений о производительности является настраиваемой и может отображать активные сообщения по заказчикам, услугам, технологиям и регионам. Удобные средства навигации позволяют открывать ретроспетивные и текущие отчеты с подробными данными и с помощью механизма “drill-down” переходить к отдельному элементу, деградация которого привела к падению производительности.
  
Рис. 2 Live Status показывает текущие состояния аварийных сообщений в бизнес-топологии системы. Средство навигации, позволяет открывать как текущие отчеты, так и получать оперативный доступ к соответствующим ретроспективным данным (“drill-down”)
Live Exceptions – основываясь на алгоритмах и правилах (Rules), приложение позволяет установить различные пороговые значения для отслеживаемых показателей, и при их снижении генерировать аварийные сообщения в системы OSS Fault Management. У интерфейса есть три интерактивных компонента — схема событий, организационное представление и таблица событий. На схеме событий в верхней части окна отображается количество активных аварийных сообщений или нештатных ситуаций по времени, а в таблице событий внизу приведены подробные сведения обо всех событиях выбранной в представлении организации группы.
  

Live Trend – инструмент позволяющий визуализировать данные получаемые с сетевых устройств в реальном времени. Наличие этого модуля позволяет инженерам быстрее решить возникшие проблемы в on-line. Доступ к Live Trend обеспечивается простым “drill-down” из Live Exceptions или Live Status.
   
2.4. Программный модуль CA eHealth Distributed eHealth
Масштабируемое решение для географически неоднородных сред eHealth Distributed eHealth предназначено для распределения функций сбора, анализа и хранения данных по нескольким компьютерам, находящимся за корпоративным сетевым экраном или снаружи. Программное обеспечение создает целостное представление всего предприятия на одной сетевой рабочей станции с Web-интерфейсом.
2.5. Программный модуль CA eHealth Traffic Accountant
CA eHealth Traffic Accountant создает представление о загрузке сети корпоративного уровня и автоматические отчеты о потреблении ресурсов сети пользователями, подразделениями, регионами или приложениями. Это программное обеспечение импортирует и анализирует данные Netflow и RMON2 и, используя разнообразные возможности группировки и сортировки данных, формирует краткие и понятные отчеты о тенденциях и профилях потребления, могущих повлиять на производительность сети.
eHealth Traffic Accountant предлагает три класса отчетов:
Оперативные отчеты позволяют получать информацию о конкретном узле или системе, об отдельном пробе, об специфичном подмножестве объектов или определенной группы внутри этого подмножества. Семь предопределенных типов отчетов позволят определить следующие показатели:
• Наиболее активные узлы в заданном сетевом сегменте или по заданному интерфейсу.
• Узлы, осуществляющие коммуникации с определенным узлом.
• Приложения, используемые определенным узлом или сегментом сети.
• Приложения, имеющие наибольшую активность по данным определенного проба.
• Наибольший объем данных, прошедший по определенному каналу.
Стандартные отчеты также предоставляют информацию об узлах, группах, срезах, пробах и сети, но, в отличие от Оперативных отчетов, они гораздо гибче и позволяют проводить более глубокий и комплексный анализ. Эти предопределенные отчеты могут помочь в планировании и анализе сетевого трафика с целью достижения следующих задач: 
• Соотнесение затрат на сетевую инфраструктуру с группами пользователей, использующих ее.
• Ранжирование департаментов компании по коэффициенту использования сетевого ресурса.
• Группировка пользователей по типам используемых ресурсов, например таких как сервер, или шлюз.
• Создание профилей используемых приложений, по определенным группам сетевых узлов.
• Определение узлов, потребляющих интернет трафик.
• Определение доступа неавторизованных узлов к определенным сетевым компонентам или серверам.
Заказные отчеты позволяют создать свои собственные отчеты для получения специфических информационных срезов о работе ИТ инфраструктуры. Заказные отчеты могут быть как вариацией Стандартных отчетов, так и отчетами, созданными «с нуля».
 
 


2.6. Программный модуль CA eHealth Business Service Console
Консоль бизнес-услуг eHealth создает высокоуровневое представление о доступности и производительности внутренних и предназначенных для пользователей бизнес-услуг в реальном времени. Этот инструмент использует Web-технологии, работает под управлением Solaris, HP/UX и Windows, и выводит на экран представления, настраиваемые в соответствии с требованиями конкретных задач.
 
2.7. Программный модуль CA eHealth Report Center
CA eHealth Report Center позволяет управлять существующими, создавать дополнительные пользовательские отчеты и выводить информацию, собираемую системой eHealth, о работе сетевых элементов. Опытные пользователи могут использовать средство инструментальной разработки Query Studio, с WEB интерфейсом и механизмами drag and drop для выборки дополнительной информации необходимой при устранении проблем на сети.
Специалисты по разработке отчетов затем могут их использовать для создания новых форм отчетов для конечных пользователей. Готовые формы отчетов могут быть поставлены в очередь на генерацию по расписанию. На рисунке ниже показано общее взаимодействие компонентов модуля CA eHealth Report Center.
 
Используя функциональные возможности системы eHealth, пользователь получает удобную систему по генерации отчетности о работе производительности отдельных сетевых объектов и сетевой инфраструктуры в целом. На рисунках представленных ниже показаны варианты готовых форм отчетов системы CA eHealth.
   
2.8. Программный модуль интеграции CA eHealth с CA Spectrum
Интеграция продуктов CA eHealth и CA SPECTRUM позволяет объединить лучшее в своем классе управление неисправностями и производительностью в едином унифицированном управляющем решении, обеспечивая высокий уровень доступности и скорость отклика важнейших бизнес-услуг. Аварийные сообщения eHealth интегрируются в SPECTRUM и отображаются через интерфейс OneClick. Глобальные наборы данных SPECTRUM выделяют полученные eHealth данные и поддерживают контекстно-зависимый запуск отчетов eHealth из аварийных сообщений и представлений топологии SPECTRUM.

Комментариев нет: