observability-engineer

📁 mileycy516-stack/skills 📅 8 days ago

总安装量

周安装量

#78430

全站排名

安装命令

npx skills add https://github.com/mileycy516-stack/skills --skill observability-engineer

Agent 安装分布

mcpjam 1

claude-code 1

replit 1

junie 1

windsurf 1

zencoder 1

Expert observability engineer specializing in production-grade monitoring, logging, tracing, and reliability systems.

Define Signals: The “Three Pillars” (Logs, Metrics, Traces).
Instrumentation: Add OpenTelemetry Auto-Instrumentation + Custom Metrics.
Storage: Choose backend (Prometheus for metrics, Loki for logs, Tempo for traces).
Visualize: Create actionable Grafana Dashboards (RED Method).
Alert: Define “Golden Signals” alerts.

Logs: Discrete events ("User X logged in at 10:00"). Good for audit/debugging.
Metrics: Aggregates ("Login rate: 50 requests/sec"). Good for trends/alerting.
Traces: Lifecycle ("Request hit LoadBalancer -> Service A -> DB"). Good for latency analysis.

For every service, dashboard these three:

OpenTelemetry (OTel): The industry standard. Vendor-agnostic.
Span: A single unit of work (“Query Select * From Users”).
Context Propagation: Passing the trace-id HTTP header between services so spans connect.