rancher-cluster-inspection

📁 futuretea/rancher-assistant 📅 Today

总安装量

周安装量

安装命令

npx skills add https://github.com/futuretea/rancher-assistant --skill rancher-cluster-inspection

Agent 安装分布

windsurf 1

amp 1

cline 1

opencode 1

cursor 1

kimi-cli 1

Skill 文档

Rancher éç¾¤å·¡æ£ï¼å¤ Agent å¹¶è¡çï¼

æ¶ææ¦è§

ç¨æ·è¯·æ± â Skill è¯å«å·¡æ£ç±»å â å¹¶è¡å¯å¨ç»´åº¦ Agent â æ±æ»æ¥å
                                    ââ cluster-info-inspector   (éç¾¤ä¿¡æ¯)
                                    ââ node-health-inspector    (èç¹å¥åº·)
                                    ââ capacity-inspector       (èµæºå®¹é)
                                    ââ workload-inspector       (å·¥ä½è´è½½)
                                    ââ event-inspector          (å¼å¸¸äºä»¶)
                                    ââ system-inspector         (ç³»ç»ç»ä»¶)

å¯ç¨ Sub-Agentï¼6 ä¸ªç»´åº¦ Agentï¼

1. `rancher-cluster-info-inspector`

ç»´åº¦: éç¾¤åºç¡ä¿¡æ¯ æ£æ¥é¡¹: éç¾¤ç¶æãK8s çæ¬ãé¡¹ç®æ°éãå½åç©ºé´æ°éãProvider ä¿¡æ¯

2. `rancher-node-health-inspector`

ç»´åº¦: èç¹å¥åº· æ£æ¥é¡¹: Ready ç¶æãMemoryPressureãDiskPressureãPIDPressureãTaints/Cordonedãkubelet çæ¬ä¸è´æ§

3. `rancher-capacity-inspector`

ç»´åº¦: èµæºå®¹é æ£æ¥é¡¹: CPU/ååè¯·æ±/éå¶/ä½¿ç¨çãPod æ°éãè¿åº¦åéæ£æµ

4. `rancher-workload-inspector`

ç»´åº¦: å·¥ä½è´è½½å¥åº· æ£æ¥é¡¹: Deployment/StatefulSet/DaemonSet å¯ç¨æ§ãå¼å¸¸ Podãé«éå¯ Pod

5. `rancher-event-inspector`

ç»´åº¦: å¼å¸¸äºä»¶ æ£æ¥é¡¹: Warning äºä»¶ãOOMKillingãFailedSchedulingãEvictedãé«é¢éå¤äºä»¶

6. `rancher-system-inspector`

ç»´åº¦: ç³»ç»ç»ä»¶ æ£æ¥é¡¹: CoreDNSãkube-proxyãmetrics-serverãcattle-agentãfleet-agentãIngress Controller

å³çæ

ç¨æ·è¯·æ±ï¼
ââ "éç¾¤å·¡æ£" / "cluster inspection" / "å¥åº·æ£æ¥" / "éç¾¤ä½æ£"
â  ââ å¹¶è¡å¯å¨ 6 ä¸ªç»´åº¦ Agentï¼å®æ´å·¡æ£ï¼
â
ââ "å¿«éæ£æ¥" / "quick check" / "ç®åççéç¾¤ç¶æ"
â  ââ å¹¶è¡å¯å¨ 3 ä¸ªç»´åº¦ Agentï¼cluster-info + node-health + eventï¼
â
ââ "èç¹å·¡æ£" / "æ£æ¥ææèç¹" / "node inspection"
â  ââ å¹¶è¡å¯å¨ 2 ä¸ªç»´åº¦ Agentï¼node-health + capacityï¼
â
ââ "å·¥ä½è´è½½å·¡æ£" / "åºç¨å¥åº·æ£æ¥" / "workload inspection"
â  ââ å¹¶è¡å¯å¨ 2 ä¸ªç»´åº¦ Agentï¼workload + eventï¼
â
ââ "äºä»¶å·¡æ£" / "æ£æ¥å¼å¸¸äºä»¶" / "event inspection"
â  ââ å¯å¨ 1 ä¸ªç»´åº¦ Agentï¼eventï¼
â
ââ "ç³»ç»ç»ä»¶å·¡æ£" / "æ£æ¥ç³»ç»ç»ä»¶" / "system inspection"
â  ââ å¯å¨ 1 ä¸ªç»´åº¦ Agentï¼systemï¼
â
ââ "å·¡æ£ææéç¾¤" / "å¨é¨éç¾¤ä½æ£" / "inspect all clusters"
â  ââ è·åéç¾¤åè¡¨ â ä¸ºæ¯ä¸ªéç¾¤å¹¶è¡å¯å¨ 6 ä¸ªç»´åº¦ Agent
â
ââ "åæ´åæ£æ¥" / "pre-change check"
â  ââ å¹¶è¡å¯å¨ 6 ä¸ªç»´åº¦ Agentï¼å®æ´å·¡æ£ï¼è®°å½åºçº¿ï¼
â
ââ "åæ´åæ£æ¥" / "post-change check"
   ââ å¹¶è¡å¯å¨ 6 ä¸ªç»´åº¦ Agentï¼å®æ´å·¡æ£ï¼ä¸åºçº¿å¯¹æ¯ï¼

å¹¶è¡æ§è¡æ¨¡å¼

æ¨¡å¼ 1: åéç¾¤å®æ´å·¡æ£ï¼6 Agent å¹¶è¡ï¼

ç¨æ·: "å¯¹ production éç¾¤åä¸æ¬¡å®æ´å·¡æ£"

â æ¥éª¤ 1: ç¡®å®éç¾¤ IDï¼å¦éè¦ï¼ä½¿ç¨ cluster_list æç´¢ï¼
â æ¥éª¤ 2: åæ¶å¯å¨ 6 ä¸ªç»´åº¦ Agent
  Agent 1: rancher-cluster-info-inspectorï¼éç¾¤ c-abc123ï¼
  Agent 2: rancher-node-health-inspectorï¼éç¾¤ c-abc123ï¼
  Agent 3: rancher-capacity-inspectorï¼éç¾¤ c-abc123ï¼
  Agent 4: rancher-workload-inspectorï¼éç¾¤ c-abc123ï¼
  Agent 5: rancher-event-inspectorï¼éç¾¤ c-abc123ï¼
  Agent 6: rancher-system-inspectorï¼éç¾¤ c-abc123ï¼
â æ¥éª¤ 3: æ±æ» 6 ä¸ªç»´åº¦æ¥åï¼è®¡ç®æ´ä½è¯åï¼çæå®æ´å·¡æ£æ¥å

æ¨¡å¼ 2: å¤éç¾¤å¹¶è¡å·¡æ£ï¼N éç¾¤ Ã 6 Agentï¼

ç¨æ·: "å·¡æ£ææéç¾¤"

â æ¥éª¤ 1: è°ç¨ cluster_list è·åææéç¾¤
â æ¥éª¤ 2: ä¸ºæ¯ä¸ªéç¾¤åæ¶å¯å¨ 6 ä¸ªç»´åº¦ Agent
  éç¾¤ production (c-abc123): 6 ä¸ªç»´åº¦ Agent
  éç¾¤ staging (c-def456):    6 ä¸ªç»´åº¦ Agent
  éç¾¤ dev (c-ghi789):        6 ä¸ªç»´åº¦ Agent
  ï¼å± 18 ä¸ª Agent å¹¶è¡è¿è¡ï¼
â æ¥éª¤ 3: åå«æ±æ»æ¯ä¸ªéç¾¤çå·¡æ£æ¥å
â æ¥éª¤ 4: çæå¤éç¾¤å·¡æ£æ»è§

æ¨¡å¼ 3: å¿«éå·¡æ£ï¼3 Agent å¹¶è¡ï¼

ç¨æ·: "å¿«éæ£æ¥ä¸ä¸ production éç¾¤"

â å¹¶è¡å¯å¨ 3 ä¸ªç»´åº¦ Agentï¼
  Agent 1: rancher-cluster-info-inspector
  Agent 2: rancher-node-health-inspector
  Agent 3: rancher-event-inspector
â æ±æ»æ¥åï¼ä»å« 3 ä¸ªç»´åº¦ï¼

æ¨¡å¼ 4: æå®å½åç©ºé´å·¡æ£

ç¨æ·: "å·¡æ£ production éç¾¤ç app å monitoring å½åç©ºé´"

â å¹¶è¡å¯å¨ç»´åº¦ Agentï¼ä¼ å¥ namespaces åæ°ï¼ï¼
  Agent 1: rancher-workload-inspectorï¼namespaces: ["app", "monitoring"]ï¼
  Agent 2: rancher-event-inspectorï¼namespaces: ["app", "monitoring"]ï¼
â èç¦æå®å½åç©ºé´çæ£æ¥ç»æ

æ¨¡å¼ 5: åæ´ååå¯¹æ¯å·¡æ£

ç¨æ·: "åä¸æ¬¡åæ´åå·¡æ£"

â å¹¶è¡å¯å¨ 6 ä¸ªç»´åº¦ Agentï¼å®æ´å·¡æ£ï¼
â ä¿åæ¥åä½ä¸ºåºçº¿

ç¨æ·ï¼åæ´åï¼: "ååæ´åæ£æ¥"

â å¹¶è¡å¯å¨ 6 ä¸ªç»´åº¦ Agentï¼å®æ´å·¡æ£ï¼
â ä¸ä¹åçåºçº¿å¯¹æ¯ï¼é«äº®ååé¡¹

å·¥ä½æµ

æ¥éª¤ 1: è¯å«å·¡æ£ç±»å

å®æ´å·¡æ£ vs å¿«éå·¡æ£ vs ä¸é¡¹å·¡æ£ï¼
åéç¾¤ vs å¤éç¾¤ï¼
æ¯å¦æå®å½åç©ºé´ï¼

æ¥éª¤ 2: è·åéç¾¤ä¿¡æ¯

å¦æç¨æ·æä¾éç¾¤åç§°èé IDï¼

â ä½¿ç¨ cluster_listï¼name: "å³é®è¯"ï¼æç´¢
â è·åå¹éçéç¾¤ ID

å¦æç¨æ·è¦æ±å·¡æ£”ææéç¾¤”ï¼

â ä½¿ç¨ cluster_list è·åå®æ´åè¡¨

æ¥éª¤ 3: å¹¶è¡å¯å¨ç»´åº¦ Agent

å®æ´å·¡æ£ï¼6 Agent å¹¶è¡ï¼ï¼

// åæ¶å¯å¨ 6 ä¸ªç»´åº¦ Agent
const tasks = [
  Task({
    subagent_type: "general-purpose",
    description: "å·¡æ£éç¾¤åºç¡ä¿¡æ¯",
    prompt: `ä½ æ¯ rancher-cluster-info-inspectorãå¯¹éç¾¤ ${cluster}ï¼${name}ï¼æ§è¡éç¾¤åºç¡ä¿¡æ¯å·¡æ£ãæ£æ¥éç¾¤ç¶æãK8s çæ¬ãé¡¹ç®åå½åç©ºé´æ¦åµãè¿åæ ååç»´åº¦æ¥åï¼å« dimensionãscoreãstatusãitemsãissuesãrecommendationsï¼ã`
  }),
  Task({
    subagent_type: "general-purpose",
    description: "å·¡æ£èç¹å¥åº·",
    prompt: `ä½ æ¯ rancher-node-health-inspectorãå¯¹éç¾¤ ${cluster}ï¼${name}ï¼æ§è¡èç¹å¥åº·å·¡æ£ãæ£æ¥ Ready ç¶æãConditionsãTaintsãkubelet çæ¬ä¸è´æ§ãè¿åæ ååç»´åº¦æ¥åã`
  }),
  Task({
    subagent_type: "general-purpose",
    description: "å·¡æ£èµæºå®¹é",
    prompt: `ä½ æ¯ rancher-capacity-inspectorãå¯¹éç¾¤ ${cluster}ï¼${name}ï¼æ§è¡èµæºå®¹éå·¡æ£ãæ£æ¥ CPU/ååè¯·æ±/éå¶/ä½¿ç¨çãPod æ°éãè¿åº¦åéãè¿åæ ååç»´åº¦æ¥åã`
  }),
  Task({
    subagent_type: "general-purpose",
    description: "å·¡æ£å·¥ä½è´è½½",
    prompt: `ä½ æ¯ rancher-workload-inspectorãå¯¹éç¾¤ ${cluster}ï¼${name}ï¼æ§è¡å·¥ä½è´è½½å¥åº·å·¡æ£ãæ£æ¥ Deployment/StatefulSet/DaemonSet å¯ç¨æ§ãå¼å¸¸ Podãè¿åæ ååç»´åº¦æ¥åã`
  }),
  Task({
    subagent_type: "general-purpose",
    description: "å·¡æ£å¼å¸¸äºä»¶",
    prompt: `ä½ æ¯ rancher-event-inspectorãå¯¹éç¾¤ ${cluster}ï¼${name}ï¼æ§è¡å¼å¸¸äºä»¶å·¡æ£ãæ£æ¥ Warning äºä»¶ãOOMKillingãFailedScheduling çå³é®äºä»¶ãè¿åæ ååç»´åº¦æ¥åã`
  }),
  Task({
    subagent_type: "general-purpose",
    description: "å·¡æ£ç³»ç»ç»ä»¶",
    prompt: `ä½ æ¯ rancher-system-inspectorãå¯¹éç¾¤ ${cluster}ï¼${name}ï¼æ§è¡ç³»ç»ç»ä»¶å·¡æ£ãæ£æ¥ kube-systemãcattle-system æ ¸å¿ç»ä»¶ç¶æãè¿åæ ååç»´åº¦æ¥åã`
  })
];
const results = await Promise.all(tasks);

å¿«éå·¡æ£ï¼3 Agent å¹¶è¡ï¼ï¼

const tasks = [
  Task({ ... description: "å·¡æ£éç¾¤åºç¡ä¿¡æ¯", prompt: "rancher-cluster-info-inspector ..." }),
  Task({ ... description: "å·¡æ£èç¹å¥åº·", prompt: "rancher-node-health-inspector ..." }),
  Task({ ... description: "å·¡æ£å¼å¸¸äºä»¶", prompt: "rancher-event-inspector ..." })
];

å¤éç¾¤å·¡æ£ï¼N Ã 6 Agent å¹¶è¡ï¼ï¼

const clusters = await cluster_list();
const tasks = clusters.flatMap(c => [
  Task({ ... prompt: `rancher-cluster-info-inspector for ${c.id}` }),
  Task({ ... prompt: `rancher-node-health-inspector for ${c.id}` }),
  Task({ ... prompt: `rancher-capacity-inspector for ${c.id}` }),
  Task({ ... prompt: `rancher-workload-inspector for ${c.id}` }),
  Task({ ... prompt: `rancher-event-inspector for ${c.id}` }),
  Task({ ... prompt: `rancher-system-inspector for ${c.id}` })
]);
const results = await Promise.all(tasks);
// æéç¾¤åç»æ±æ»

æ¥éª¤ 4: æ±æ»å·¡æ£æ¥å

æ¶éææç»´åº¦ Agent çè¿åç»æ
æ±æ»è¯åæ¦è§è¡¨æ ¼
åå¹¶åç»´åº¦çè¯¦ç»æ£æ¥ç»æ
åå¹¶é®é¢æ¸åï¼æä¸¥éç¨åº¦æåºï¼
åå¹¶æ¹è¿å»ºè®®ï¼æä¼åçº§æåºï¼
è®¡ç®æ´ä½è¯åï¼ååç»´åº¦æä½åï¼

ååºæ ¼å¼

åéç¾¤å·¡æ£æ¥å

## éç¾¤å·¡æ£æ¥å: production (c-abc123)

### å·¡æ£æ¦è§
- å·¡æ£æ¶é´: 2025-01-15 10:30
- å·¡æ£èå´: å®æ´å·¡æ£ï¼6 ç»´åº¦å¹¶è¡ï¼
- **æ´ä½è¯å: Bï¼è¯å¥½ï¼**

### è¯åæ¦è§
| ç»´åº¦ | Agent | è¯å | ç¶æ |
|------|-------|------|------|
| éç¾¤åºç¡ä¿¡æ¯ | cluster-info-inspector | A | â æ£å¸¸ |
| èç¹å¥åº· | node-health-inspector | B | â ï¸ æ³¨æ |
| èµæºå®¹é | capacity-inspector | A | â æ£å¸¸ |
| å·¥ä½è´è½½å¥åº· | workload-inspector | B | â ï¸ æ³¨æ |
| å¼å¸¸äºä»¶ | event-inspector | A | â æ£å¸¸ |
| ç³»ç»ç»ä»¶ | system-inspector | A | â æ£å¸¸ |

### é®é¢æ¸å
| ä¸¥éç¨åº¦ | ç»´åº¦ | é®é¢ | å»ºè®® |
|----------|------|------|------|
| â ï¸ | èç¹å¥åº· | node-5 NotReady | æ£æ¥ kubelet |
| â ï¸ | å·¥ä½è´è½½ | 2 ä¸ª Pod CrashLoopBackOff | æ¥çæ¥å¿ |

### æ¹è¿å»ºè®®
1. **[ç´§æ¥]** ä¿®å¤ node-5
2. **[å»ºè®®]** ææ¥å´©æº Pod

å¤éç¾¤å·¡æ£æ»è§

## å¤éç¾¤å·¡æ£æ»è§

| éç¾¤ | è¯å | éç¾¤ä¿¡æ¯ | èç¹ | å®¹é | å·¥ä½è´è½½ | äºä»¶ | ç³»ç» | å³é®é®é¢ |
|------|------|----------|------|------|----------|------|------|----------|
| production | B | â | â ï¸ | â | â ï¸ | â | â | 1 èç¹ NotReady |
| staging | A | â | â | â | â | â | â | æ  |
| dev | C | â | â ï¸ | â ï¸ | â ï¸ | â ï¸ | â | å®¹éä¸è¶³ |

### éç¾¤è¯¦æ
[åéç¾¤ç¬ç«å·¡æ£æ¥å...]

å·¡æ£èå´ â Agent æ å°éæ¥è¡¨

èå´	Agent æ°é	ç»´åº¦ Agent
full	6	cluster-info + node-health + capacity + workload + event + system
quick	3	cluster-info + node-health + event
nodes	2	node-health + capacity
workloads	2	workload + event
events	1	event
system	1	system

å·¡æ£æä½³å®è·µ

å¨å·¡æ£ï¼æ¯å¨æ§è¡ full å·¡æ£ï¼6 Agentï¼ï¼è¦çææç»´åº¦
åæ´å·¡æ£ï¼éå¤§åæ´ååååä¸æ¬¡ full å·¡æ£ï¼å¯¹æ¯å·®å¼
å¤éç¾¤ï¼å®æå¯¹ææéç¾¤å full å·¡æ£ï¼çæå¥åº·è¶å¿

éè¯¯å¤ç

ç»´åº¦ Agent å¤±è´¥: å¨æ¥åä¸æ æ³¨è¯¥ç»´åº¦ä¸º”å·¡æ£å¤±è´¥”ï¼ä¸å½±åå¶ä»ç»´åº¦è¯å
metrics-server æªå®è£: capacity-inspector è·³è¿å®éä½¿ç¨çï¼æ¥åä¸æ³¨æ
éç¾¤ä¸å¯è¾¾: æ è®°ä¸ºå·¡æ£å¤±è´¥ï¼æ¥åéç¾¤è¿æ¥é®é¢
æéä¸è¶³: å Agent å°½å¯è½å·¡æ£å¯è®¿é®èµæºï¼æ³¨ææééå¶
æ°æ®ä¸å®æ´: åºäºå¯ç¨æ°æ®çææ¥åï¼æ æ³¨ç¼ºå¤±é¡¹

ä¸å¶ä»æè½çå³ç³»

å·¡æ£åç°é®é¢	åç»è¡å¨	ä½¿ç¨æè½
èç¹ NotReady	æ·±å¥åæèç¹	capacity-analysis
Pod CrashLoopBackOff	è¯æ Pod	resource-troubleshooting
Deployment ä¸å¯ç¨	æ¥çé¨ç½²åæ´	deployment-management
èµæºä¸è¶³	å®¹éè§å	capacity-analysis
å¯çäºä»¶	è¿½æº¯èµæºåæ´	resource-discovery

GitHub 仓库 ↗ ← 返回陌讯 Skills 聚合平台

rancher-cluster-inspection

Agent 安装分布

Skill 文档

Rancher éç¾¤å·¡æ£ï¼å¤ Agent å¹¶è¡çï¼

æ¶ææ¦è§

å¯ç¨ Sub-Agentï¼6 ä¸ªç»´åº¦ Agentï¼

1. rancher-cluster-info-inspector

2. rancher-node-health-inspector

3. rancher-capacity-inspector

4. rancher-workload-inspector

5. rancher-event-inspector

6. rancher-system-inspector

å³ç­æ 

å¹¶è¡æ§è¡æ¨¡å¼

æ¨¡å¼ 1: åéç¾¤å®æ´å·¡æ£ï¼6 Agent å¹¶è¡ï¼

æ¨¡å¼ 2: å¤éç¾¤å¹¶è¡å·¡æ£ï¼N éç¾¤ Ã 6 Agentï¼

æ¨¡å¼ 3: å¿«éå·¡æ£ï¼3 Agent å¹¶è¡ï¼

æ¨¡å¼ 4: æå®å½åç©ºé´å·¡æ£

æ¨¡å¼ 5: åæ´ååå¯¹æ¯å·¡æ£

å·¥ä½æµ

æ­¥éª¤ 1: è¯å«å·¡æ£ç±»å

æ­¥éª¤ 2: è·åéç¾¤ä¿¡æ¯

æ­¥éª¤ 3: å¹¶è¡å¯å¨ç»´åº¦ Agent

æ­¥éª¤ 4: æ±æ»å·¡æ£æ¥å

ååºæ ¼å¼

åéç¾¤å·¡æ£æ¥å

å¤éç¾¤å·¡æ£æ»è§

å·¡æ£èå´ â Agent æ å°éæ¥è¡¨

å·¡æ£æä½³å®è·µ

éè¯¯å¤ç

ä¸å ¶ä»æè½çå ³ç³»