Мониторинг производительности сети

AggreGate Network Manager обеспечивает сбор всех необходимых данных о производительности сети в целом, отдельных сетевых компонентов и приложений, предоставляя всю информацию, требующуюся для диагностики и предотвращения сбоев, а также для планирования развития информационной инфраструктуры вашего бизнеса. Ключевыми показателями производительности являются:

Использование пропускной способности маршрутизаторов и коммутаторов
Загруженность процессоров и памяти на серверах и других сетевых устройствах
Использование имеющегося пространства для хранения информации на серверах, дисковых массивах, магнитных лентах и других типах накопителей
Время отклика приложений и сервисов
Время непрерывной работы серверов
Качество сетевых соединений (задержки, потери пакетов, помехи и т.д.)
Задаваемые пользователями метрики (такие, как уровень WiFi-сигнала)

Для всех показателей производительности в системе реализованы соответствующие аналитические инструменты: тревоги, диаграммы, отчёты. Полученные показатели сохраняются в серверной базе данных и доступны для долговременного статистического анализа.

Мониторинг загрузки процессора

Система осуществляет мониторинг загрузки процессора на серверах, маршрутизаторах, управляемых коммутаторах и любом другом оборудовании, предоставляющем информацию об использовании процессора по SNMP. Использование ресурсов процессора отслеживается отдельно по каждому процессору или процессорному ядру.

Можно назначить тревогу, оповещающую о том, что на одном из устройств загрузка процессора превышает заданный порог в течение определенного (также заданного пользователем) периода времени. Настройки тревог, процедуры оповещения и корректирующие действия могут быть применены сразу к нескольким устройствами или сконфигурированы для каждого устройства отдельно.

Использование процессора можно также отслеживать для отдельных процессов, запущенных на удалённой машине.

Мониторинг дискового пространства и использования оперативной памяти

Мониторинг дискового пространства на серверах и сетевых запоминающих устройствах также осуществляется по SNMP. AggreGate Network Manager получает метки и данные по свободному/занятому пространству для всех дисков, разделов и файловых систем. В поставку включены настраиваемые графики по использованию оперативной памяти и дискового пространства.

Графики по дисковому пространству могут быть дополнены трендами линейной регрессии, позволяющими спрогнозировать момент, когда свободное место на носителе закончится.

Отслеживается также использование памяти отдельными процессами, запущенными на удалённых серверах и рабочих станциях как в абсолютных единицах, так и относительно общего объёма.

Пользовательские показатели производительности

AggreGate Network Manager может предоставить любые метрики производительности, данные для расчёта которых доступны по SNMP, WMI, CLI, или любому другому доступному на платформе AggreGate протоколу удалённого мониторинга (Modbus, BACnet, OPC, и т.д.)

Например, можно использовать следующие показатели:

  • Уровень сигнала беспроводной сети (SNMP)
  • Количество потоков выполнения на сервере приложения (JMX)
  • Размер файла подкачки Windows (WMI)

Платформа для Интернета вещей AggreGate предоставляет широкие возможности для обработки и анализа любых показателей. Более подробная информация доступна в разделе «Технология».

Мониторинг времени отклика

Существует целый ряд возможных причин снижения производительности сетевого приложения: медленное сетевое соединение, недостаток памяти, высокая загрузка процессора, внутренние проблемы в программе и т.д. Обобщающим показателем, достаточно корректно отражающим общее состояние приложения, является время отклика - промежуток времени между отсылкой запроса, специально сгенерированного для этого приложения, и моментом получения ответа.

Примеры времени отклика для различных приложений:

  • Время загрузки веб-страницы
  • Время выполнения SQL-запроса
  • Время загрузки файла с удалённого FTP-сервера
  • Общее время выполнения скрипта на удалённом компьютере

Система также измеряет время отклика контролируемой системы с помощью ICMP-запроса (ping), а также отслеживает процент потерянных пакетов. Это позволяет значительно облегчить и ускорить выявление проблем, связанных с производительностью сети.

Мониторинг использования пропускной способности

С помощью AggreGate Network Manager, системные администраторы могут получать оповещения, когда объём трафика на любом из сетевых интерфейсов маршрутизатора/коммутатора приближается к его пропускной способности (или заданному пределу). Применяя специальные средства анализа трафика (такие, как NetFlow), можно подробнее изучить трафик и определить источник (сетевой узел, приложение) повышенной нагрузки на сеть.

Подробнее см. в разделе «Мониторинг трафика».

Панель «Рейтинг производительности: Топ 10»

Работа администратора начинается с обзора своих «владений». Панель «Рейтинг производительности: Топ 10» создана специально для того, чтобы исключить нудную, повторяющуюся работу по проверке различных ресурсов и сведению данных по загруженным и проблемным элементам в общий список.

Оповещения о падении производительности

Механизм тревог, предоставляемый платформой AggreGate, позволяет обнаруживать падение производительности даже в самых сложных случаях. Вот, например, только несколько примеров сложных условий возникновения тревоги:

Активация тревоги «DDoS-атака», если несколько событий типа «Перегрузка» возникли в течение определённого интервала
Активация тревоги, если загрузка процессора превышает 80% в течение более, чем 5 минут, и её автоматическая деактивация, если нагрузка падает ниже 30% и остаётся такой в течение часа
Активации тревоги, когда более чем X серверов в кластере становятся недоступными или их производительность не соответствует заданным критериям
Предупреждение о предстоящем нарушении SLA многокомпонентного бизнес-сервиса на основе анализа тренда его KPI

Кроме оповещения, для каждой тревоги можно потребовать подтверждение оператора и задать автоматические или интерактивные корректирующие действия. Например, при возникновении связанной с производительностью тревоги AggreGate Network Manager может выполнить перезапуск определённого сервиса или всего сервера.