Prometheus

Infrastructure

Truy vấn chỉ số, điều tra cảnh báo và hiểu sức khỏe hệ thống — Neotask nói PromQL qua OpenClaw.

Bạn có thể làm gì

Truy vấn chỉ số mà không cần viết PromQL

Mô tả muốn đo gì — "cho tôi sử dụng CPU mỗi pod trong namespace production một giờ qua" — và Neotask viết và chạy biểu thức PromQL, trả kết quả dạng dễ đọc với ngữ cảnh về con số nghĩa gì.

Điều tra cảnh báo đang hoạt động

Khi cảnh báo kích hoạt, yêu cầu Neotask lấy chỉ số cơ bản, cho bạn thấy xu hướng kích hoạt và giải thích liệu trông như spike hay suy giảm kéo dài. Đi từ "cảnh báo kích hoạt" đến "nguyên nhân gốc" nhanh hơn.

Xây dựng quy tắc cảnh báo

Mô tả ý định cảnh báo bằng tiếng Việt — "cảnh báo nếu bất kỳ pod nào khởi động lại hơn 5 lần trong 10 phút" — và Neotask tạo biểu thức PromQL chính xác, đặt label và annotation hợp lý, định dạng quy tắc ở dạng YAML Prometheus.

Khám phá chỉ số có sẵn

Hỏi chỉ số nào đang được scrape từ target cụ thể, job nào hiện đang down hoặc label nào có sẵn trên chỉ số cụ thể. Neotask truy vấn API Prometheus để khám phá danh mục chỉ số.

Phân tích xu hướng và dung lượng

Hỏi tóm tắt về cách chỉ số quan trọng (như tốc độ yêu cầu, tỷ lệ lỗi hoặc sử dụng ổ đĩa) đã biến đổi tuần qua. Nhận diễn giải ngôn ngữ đơn giản: "tỷ lệ lỗi tăng gấp đôi tối thứ Ba, tương quan với triển khai v2.3."

Thử hỏi

  • "Sử dụng CPU hiện tại cho mỗi node trong cụm là bao nhiêu?"
  • "Cho tôi percentile 95 độ trễ yêu cầu cho payment-service"
  • "Viết truy vấn PromQL theo dõi sử dụng bộ nhớ mỗi namespace"
  • "Target Prometheus nào hiện đang down?"
  • "Tạo alerting rule kích hoạt khi sử dụng ổ đĩa vượt 85% trong 5 phút"
  • "Tại sao cảnh báo HighMemoryUsage kích hoạt sáng nay?"
  • "Cho tôi xu hướng tỷ lệ lỗi 7 ngày qua theo dịch vụ"
  • "Chỉ số nào đang được scrape từ job node-exporter?"
  • Mẹo chuyên nghiệp

  • Hỏi hướng dẫn rate() vs irate() khi xây truy vấn — Neotask giải thích cái nào phù hợp cho counter trong trường hợp sử dụng.
  • Bao gồm khoảng thời gian trong prompt: "30 phút qua" hoặc "từ hôm qua 9 giờ sáng" để có kết quả phù hợp thay vì khoảng mặc định Prometheus.
  • Yêu cầu Neotask giải thích biểu thức PromQL bạn kế thừa — dán truy vấn và hỏi "đo gì và có vấn đề gì không?"
  • Sử dụng label matcher trong prompt: "chỉ cho dịch vụ frontend trong production" — Neotask thêm đúng label selector vào truy vấn.
  • Khi tạo alerting rule, yêu cầu Neotask bao gồm annotation runbook_url trỏ đến wiki nội bộ để phản ứng nhanh hơn khi trực.
  • Works Well With