rancher-resource-troubleshooting

📁 futuretea/rancher-assistant 📅 Today

总安装量

周安装量

#71850

全站排名

安装命令

npx skills add https://github.com/futuretea/rancher-assistant --skill rancher-resource-troubleshooting

Agent 安装分布

windsurf 1

amp 1

cline 1

opencode 1

cursor 1

kimi-cli 1

Skill 文档

Rancher èµæºææ¥

ç´æ¥æä½ï¼æ é Sub-Agentï¼

æä½	å·¥å·	ä½æ¶ç´æ¥ä½¿ç¨
æ¥ç Pod æ¥å¿	`mcp__rancher__kubernetes_logs`	æä¾æç¡®çéç¾¤ãå½åç©ºé´å Pod åç§°
æ¥çäºä»¶	`mcp__rancher__kubernetes_events`	æ¥çå½åç©ºé´æç¹å®èµæºçäºä»¶
æè¿°èµæº	`mcp__rancher__kubernetes_describe`	æ¥çåä¸ªèµæºçè¯¦ç»ä¿¡æ¯
è·åèµæº	`mcp__rancher__kubernetes_get`	è·ååä¸ªèµæºç YAML/JSON

Sub-Agent å§æ

1. `rancher-pod-diagnostician`

ä½æ¶å§æ:

ç¨æ·è¦æ±”è¯æ Pod”æ”ä¸ºä»ä¹ Pod å¤±è´¥”
éè¦ç»¼ååææ¥å¿ãäºä»¶åèµæºç¶æ
å¤ Pod å¹¶è¡è¯æ
Deployment/StatefulSet çº§å«ææ¥

åæ°:

{
  "cluster": "c-abc123",
  "namespace": "production",
  "pod_name": "api-server-abc123",
  "keyword": "error",
  "tail_lines": 200
}

2. `rancher-deployment-tracker`

ç¨äº: é¨ç½²ç¸å³é®é¢ææ¥

ä½æ¶å§æ:

é¨ç½²å¤±è´¥åææ¥åæ´åå
éè¦æ¥çåå¸åå²åçæ¬å·®å¼
çæ§æ»å¨æ´æ°è¿ç¨

å³çæ

ç¨æ·è¯·æ±ï¼
ââ "æ¥ç Pod æ¥å¿" + æä¾ Pod å
â  ââ ç´æ¥ä½¿ç¨ kubernetes_logs
â
ââ "æ¥çäºä»¶" + å½åç©ºé´/èµæº
â  ââ ç´æ¥ä½¿ç¨ kubernetes_events
â
ââ "æè¿°èµæº X"
â  ââ ç´æ¥ä½¿ç¨ kubernetes_describe
â
ââ "è¯æ Pod" / "ä¸ºä»ä¹ Pod å¤±è´¥" / "Pod ä¸å°±ç»ª"
â  ââ å§æç» rancher-pod-diagnostician
â
ââ "ææ¥ Deployment" / "é¨ç½²å¤±è´¥"
â  ââ å§æç» rancher-pod-diagnostician + rancher-deployment-tracker
â
ââ "å¤ Pod å¯¹æ¯" / "è¿äº Pod æä»ä¹é®é¢"
â  ââ å¹¶è¡å¯å¨å¤ä¸ª rancher-pod-diagnostician
â
ââ "å·¥ä½è´è½½æ¥å¿" / "ææ Pod çæ¥å¿"
   ââ ç´æ¥ä½¿ç¨ kubernetes_logsï¼labelSelector èåå¤ Pod æ¥å¿ï¼

å¹¶è¡æ§è¡

å¤ Pod è¯æ

ç¨æ·: "è¯æå½åç©ºé´ production ä¸ææå¤±è´¥ç Pod"
â æ¥éª¤ 1: kubernetes_list è·å Pod åè¡¨ï¼çéå¼å¸¸ Pod
â æ¥éª¤ 2: ä¸ºæ¯ä¸ªå¼å¸¸ Pod å¹¶è¡å¯å¨ diagnostician
â æ¥éª¤ 3: æ±æ»è¯æç»æ

Deployment å¨é¢ææ¥

ç¨æ·: "ææ¥ Deployment api-server çé®é¢"
â å¹¶è¡å¯å¨ï¼
  Agent 1: rancher-pod-diagnosticianï¼è¯æå³è Podï¼
  Agent 2: rancher-deployment-trackerï¼æ£æ¥åå¸åå²ååæ´ï¼
â ç»¼ååæ

å·¥ä½æµ

æ¥éª¤ 1: è¯å«ææ¥ç®æ

ä»ä¹èµæºï¼ï¼PodãDeploymentãService çï¼
ææ²¡æå·ä½çéè¯¯æè¿°ï¼

æ¥éª¤ 2: ç¡®å®ææ¥çç¥

ç®åæ¥è¯¢ â ç´æ¥è°ç¨ MCP å·¥å·
Pod è¯æ â å§æ pod-diagnostician
é¨ç½²é®é¢ â å§æ deployment-tracker
å¤æåºæ¯ â å¹¶è¡å¤ä¸ª Agent

æ¥éª¤ 3: å¯å¨ææ¥

Task({
  subagent_type: "general-purpose",
  description: "è¯æ Pod " + pod_name,
  prompt: `ä½ æ¯ rancher-pod-diagnosticianãè¯æéç¾¤ ${cluster} å½åç©ºé´ ${namespace} ä¸ Pod ${pod_name} çé®é¢ãè·å Pod è¯¦æãæ¥å¿åäºä»¶ï¼åææ ¹å ã`
})

æ¥éª¤ 4: å±ç¤ºç»æå¹¶å»ºè®®

ååºæ ¼å¼

Pod è¯æ

## Pod è¯æ: api-server-abc123

### ç¶æ
- Phase: Running
- Ready: 0/1 å®¹å¨å°±ç»ª
- éå¯æ¬¡æ°: 15
- èç¹: node-2

### é®é¢åç°
1. **CrashLoopBackOff**: å®¹å¨ `app` åå¤å´©æº
   - æè¿éåºç : 137 (OOMKilled)
   - ååéå¶: 256Mi
   - å»ºè®®: å¢å ååéå¶å° 512Mi

### å³é®æ¥å¿

[error] Out of memory: Kill process 1 (app)


### ç¸å³äºä»¶
| æ¶é´ | ç±»å | åå  | æ¶æ¯ |
|------|------|------|------|
| 2m ago | Warning | OOMKilling | Memory limit exceeded |
| 5m ago | Normal | Pulled | Container image pulled |

### å»ºè®®
1. å¢å ååéå¶
2. æ£æ¥åºç¨ååæ³æ¼
3. æ·»å èµæºçæ§

æ¥å¿æ¥è¯¢æå·§

å³é®è¯è¿æ»¤: keyword: "error" å¿«éå®ä½éè¯¯
æ¶é´èå´: sinceSeconds: 3600 æ¥çæè¿ 1 å°æ¶
å¤ Pod èå: labelSelector: "app=nginx" èåææ nginx Pod æ¥å¿
ç¹å®å®¹å¨: container: "sidecar" æ¥çç¹å®å®¹å¨æ¥å¿

éè¯¯å¤ç

Pod ä¸åå¨: ä½¿ç¨ kubernetes_list æç´¢ç±»ä¼¼åç§°ç Pod
æéä¸è¶³: æç¤ºæ£æ¥ RBAC éç½®

GitHub 仓库 ↗ ← 返回陌讯 Skills 聚合平台

rancher-resource-troubleshooting

Agent 安装分布

Skill 文档

Rancher èµæºææ¥

ç´æ¥æä½ï¼æ é Sub-Agentï¼

Sub-Agent å§æ

1. rancher-pod-diagnostician

2. rancher-deployment-tracker

å³ç­æ 

å¹¶è¡æ§è¡

å¤ Pod è¯æ­

Deployment å ¨é¢ææ¥

å·¥ä½æµ

æ­¥éª¤ 1: è¯å«ææ¥ç®æ 

æ­¥éª¤ 2: ç¡®å®ææ¥ç­ç¥

æ­¥éª¤ 3: å¯å¨ææ¥

æ­¥éª¤ 4: å±ç¤ºç»æå¹¶å»ºè®®

ååºæ ¼å¼

Pod è¯æ­

æ¥å¿æ¥è¯¢æå·§

éè¯¯å¤ç