Datadog

ความสามารถในการสังเกต

ตรวจสอบเมตริก logs และแจ้งเตือน Datadog ผ่านการสนทนา

คุณสามารถทำอะไรได้บ้าง

โครงสร้างพื้นฐานและตัวชี้วัดระบบ

ขอ CPU, หน่วยความจำ, ดิสก์ หรือตัววัดเครือข่ายทั่วทั้งโฮสต์ แท็ก หรือบริการ รับรายละเอียดเวลาแฝง p50/p95/p99 และระบุความอิ่มตัวของทรัพยากรโดยไม่ต้องเขียนไวยากรณ์คิวรี PromQL หรือ Datadog

APM และการติดตามแบบกระจาย

อัตราข้อผิดพลาดของบริการสืบค้น ปริมาณงาน และเวลาแฝง ขอให้ Neotask ค้นหาการติดตามที่ช้าหรือล้มเหลวสำหรับบริการและกรอบเวลาที่เฉพาะเจาะจง และสรุปประเภทข้อผิดพลาดที่พบบ่อยที่สุด

ตรวจสอบและสถานะการแจ้งเตือน

แสดงรายการจอภาพที่เริ่มทำงานทั้งหมด ตรวจสอบสถานะของจอภาพเฉพาะตามชื่อหรือแท็ก และรับข้อมูลสรุปประวัติการแจ้งเตือนล่าสุดสำหรับบริการหรือสภาพแวดล้อมใดๆ

การวิเคราะห์บันทึก

ค้นหาสตรีมบันทึกด้วยตัวกรองภาษาธรรมชาติ — "แสดงข้อผิดพลาดจากบริการการชำระเงินในชั่วโมงที่แล้ว" — และรับสรุปรูปแบบและความถี่ของบันทึก

SLO และการรายงานความน่าเชื่อถือ

สอบถามสถานะ SLO ปัจจุบัน ข้อผิดพลาดที่ถือว่าเหลืออยู่ และอัตราการเบิร์นสำหรับวัตถุประสงค์ที่กำหนดไว้ ทำความเข้าใจโดยสรุปว่าบริการของคุณเป็นไปตามแผนสำหรับเดือนนั้นหรือไม่

ลองถามดู

  • "เวลาแฝง p95 สำหรับบริการชำระเงินในชั่วโมงที่ผ่านมาคือเท่าใด"
  • "ขณะนี้มีจอภาพสำคัญใดบ้างที่เริ่มใช้งานจริง"
  • "แสดงอัตราข้อผิดพลาดสำหรับบริการการชำระเงินในช่วง 24 ชั่วโมงที่ผ่านมา"
  • "ค้นหา 5 การติดตามที่ช้าที่สุดสำหรับบริการตรวจสอบสิทธิ์ผู้ใช้ในวันนี้"
  • "ข้อผิดพลาดที่ถือว่าค้างรับได้สำหรับ SLO API ในเดือนนี้คือเท่าใด"
  • "สรุปข้อผิดพลาดในบันทึกบริการการชำระเงินในช่วง 30 นาทีที่ผ่านมา"
  • "โฮสต์ใดมี CPU สูงกว่า 80% ในขณะนี้"
  • "แสดงประวัติการแจ้งเตือนสำหรับการตรวจสอบฐานข้อมูลในสัปดาห์นี้"
  • เคล็ดลับมือโปร

  • ใช้แท็กบริการและสภาพแวดล้อมอย่างชัดเจน ("บริการชำระเงินในการผลิต") เพื่อหลีกเลี่ยงการสืบค้นในทุกสภาพแวดล้อมโดยไม่ได้ตั้งใจ
  • ขอสรุปการติดตามแทนที่จะติดตามแบบดิบ — "อะไรคือข้อผิดพลาดที่พบบ่อยที่สุดในการติดตามที่ช้า" ย่อช่วงหลายร้อยช่วงให้เป็นสัญญาณที่สามารถดำเนินการได้
  • รวมสถานะการตรวจสอบเข้ากับข้อความค้นหา: "การตรวจสอบการชำระเงินเริ่มทำงานหรือไม่ และบันทึกบอกว่าอย่างไร" รันทั้งสองอย่างในการดำเนินการ OpenClaw ครั้งเดียว
  • สอบถามอัตราการเผาผลาญ SLO ทุกวัน การจับอัตราการเผาผลาญที่สูงตั้งแต่เนิ่นๆ มีราคาถูกกว่าการละเมิด SLO ณ สิ้นเดือนมาก
  • Neotask สามารถเชื่อมโยงการเพิ่มขึ้นของหน่วยเมตริกกับการปรับใช้ล่าสุด: "มีอะไรปรับใช้ในช่วงเวลาที่ CPU พุ่งสูงขึ้นเมื่อเวลา 14.00 น. ของเมื่อวานหรือไม่"
  • Works Well With