Prometheus

Інфраструктура

Запитуйте метрики, досліджуйте оповіщення та розумійте стан вашої системи — Neotask розмовляє PromQL через OpenClaw.

Що ви можете робити

Запити метрик без написання PromQL

Опишіть, що хочете виміряти — "покажи використання CPU за подом у просторі імен production за останню годину" — і Neotask напише та виконає вираз PromQL, повертаючи результати у зрозумілому форматі з контекстом, що означають цифри.

Розслідування активних алертів

Коли алерт спрацьовує, попросіть Neotask отримати базові метрики, показати тренд, що його спричинив, та пояснити — це сплеск чи стійка деградація. Переходьте від "алерт спрацював" до "кореневої причини" швидше.

Побудова правил алертів

Опишіть намір алерту звичайною мовою — "алерт, якщо будь-який под перезапускається більше 5 разів за 10 хвилин" — і Neotask згенерує правильний вираз PromQL, встановить розумні мітки та анотації та форматує правило у YAML-формат Prometheus.

Дослідження доступних метрик

Запитуйте, які метрики збираються з конкретної цілі, які jobs зараз не працюють або які мітки доступні на конкретній метриці. Neotask запитує API Prometheus для дослідження каталогу метрик.

Аналіз трендів та ємності

Запитуйте підсумок тренду ключової метрики (як-от rate запитів, rate помилок або використання диску) за останній тиждень. Отримуйте інтерпретації звичайною мовою: "ваш rate помилок подвоївся у вівторок увечері, корелюючи з деплоєм v2.3."

Спробуйте запитати

  • "Яке поточне використання CPU для кожного вузла мого кластера?"
  • "Покажи 95-й перцентиль затримки запитів для payment-service"
  • "Напиши PromQL запит для відстеження використання пам'яті за простором імен"
  • "Які цілі Prometheus зараз не працюють?"
  • "Згенеруй правило алерту, що спрацьовує, коли використання диску перевищує 85% протягом 5 хвилин"
  • "Чому алерт HighMemoryUsage спрацював сьогодні вранці?"
  • "Покажи тренди rate помилок за останні 7 днів за сервісом"
  • "Які метрики збираються з job node-exporter?"
  • Поради

  • Запитуйте пояснення rate() vs irate() при побудові запитів — Neotask пояснить, що підходить для лічильників у вашому випадку.
  • Включайте часовий діапазон у запити: "за останні 30 хвилин" або "з вчорашнього 9:00" для отримання відповідних результатів замість діапазону за замовчуванням Prometheus.
  • Попросіть Neotask пояснити успадкований PromQL-вираз — вставте запит та запитайте "що це вимірює та чи є проблеми?"
  • Використовуйте збіг міток у запитах: "тільки для frontend-сервісу в production" — Neotask додасть правильні селектори міток.
  • При створенні правил алертів попросіть Neotask включити анотацію runbook_url, що вказує на вашу внутрішню вікі, для швидшого реагування чергових.
  • Works Well With