Altyn View NeurAlert

Интеллектуальная конвергенция оповещений и сценарные алерты для предотвращения alert storm

Altyn View NeurAlert — это единая платформа управления оповещениями, использующая технологии искусственного интеллекта для конвергенции алертов из таких систем мониторинга, как Zabbix, Prometheus и других. На основе машинного обучения оповещения могут срабатывать по сценариям, что эффективно предотвращает alert storm и снижает alert fatigue у команд эксплуатации.

Бесплатная пробная версия
Унифицированный мониторинг

O&M данные собираются из различных инструментов и платформ мониторинга, стандартизируются и обогащаются, после чего централизованно визуализируются. Это позволяет выполнять корреляционный анализ данных, обеспечивать глобальную наблюдаемость, комплексный анализ и более точное принятие решений.

Интеллектуальное снижение шума

С помощью комбинированного подхода «правила + ИИ» платформа выполняет интеллектуальное подавление шума событий. Это позволяет сократить частые помехи, автоматически выявлять действительно важные оповещения среди низкоуровневых событий, повышать их приоритет и своевременно уведомлять пользователей, предотвращая пропуск критических инцидентов.

Корреляция событий

С использованием технологий искусственного интеллекта, на основе анализа больших данных, дополненного контекстными моделями — такими как топология ресурсов CMDB и цепочки вызовов приложений, — платформа выявляет закономерности корреляции событий и формирует базу знаний корреляции для агрегирования взаимосвязанных событий.

Локализация неисправностей

Формируется модель причинно-следственных связей событий, которая обучается на основе исторических данных, предметных знаний и связанной информации. Это позволяет выполнять анализ первопричин и точно локализовать неисправности на основе причинно-следственных связей между событиями.

Усиление ИИ

С помощью визуального и удобного для пользователя языка можно задавать ИИ правила обучения и логику интерпретации данных. Это ускоряет обучение моделей и значительно повышает эффективность и точность ИИ-возможностей платформы.

Эффективное взаимодействие команд

Обнаруженные неисправности обрабатываются своевременно, а действия по их устранению фиксируются с помощью комментариев и ответов к событиям. Это позволяет специалистам оперативно понимать текущую ситуацию, повышать эффективность коммуникации, обеспечивать совместную обработку инцидентов и быстро реагировать на проблемы.

Множественные источники данных

Сбор данных

В настоящее время разрабатывается множество систем мониторинга, при этом данные, генерируемые каждой из них, разрознены, что не позволяет эффективно коррелировать их между собой и извлекать практическую ценность. Для O&M данных (метрик, логов, событий и топологий) платформа позволяет в реальном времени собирать метаданные из open-source инструментов мониторинга, коммерческих систем, API, очередей сообщений, электронной почты, документов и других источников. Эти данные очищаются, обрабатываются, агрегируются, анализируются и в конечном итоге централизованно визуализируются в едином пространстве.

Обнаружение аномалий

обнаружение аномалий

Слишком высокие пороги оповещений приводят к пропущенным инцидентам, а слишком низкие — к шуму и ложным срабатываниям. Платформа отказывается от неточных фиксированных и базовых порогов традиционных систем и комплексно оценивает поведение метрик с учётом периодичности, трендов, временных паттернов и других факторов. Система автоматически выбирает оптимальные алгоритмы обнаружения аномалий для анализа динамических данных в реальном времени, выявляет реальные отклонения и повышает точность оповещений.

Конвергенция оповещений

Подавление штормов оповещений

В крупномасштабных сервисных архитектурах сбой в системе может приводить к шторму повторяющихся и бесполезных оповещений, существенно усложняя работу специалистов O&M. Altyn View NeurAlert интеллектуально и автоматически фильтрует, сжимает, объединяет и дедуплицирует события оповещений, агрегируя их в единое высокоуровневое событие — уведомление о неисправности для обработки. Это позволяет значительно снизить уровень шума, информационную перегрузку и нагрузку на специалистов O&M.

Анализ первопричин

Анализ корневых причин отказов

Как в современных виртуализированных и высокоизбыточных ИТ-средах быстро определить причины сбоя? Платформа Altyn View NeurAlert использует машинное обучение для анализа контекстной информации на основе больших данных, выявляет корреляции, зависимости и причинно-следственные связи событий и выводит возможные первопричины. На основе пользовательской обратной связи алгоритмы анализа постоянно улучшаются, повышая эффективность устранения инцидентов и снижая влияние простоев сервисов.

Многоуровневое управление

с интеграцией внешних систем

Платформа интегрируется с CMDB для обогащения событий оповещений и усиления корреляции событий на основе ресурсных зависимостей, описанных в CMDB. Это позволяет расширить охват агрегации и повысить точность агрегирования событий. Агрегированные инциденты интегрируются с itsM-системами управления заявками, формируя замкнутый цикл управления устранением неисправностей на протяжении всего жизненного цикла. Дополнительно поддерживается интеграция с call-центрами для реализации голосовых уведомлений об инцидентах.