glm-understand-image

📁 thincher/awsome_skills 📅 1 day ago

总安装量

周安装量

#55192

全站排名

安装命令

npx skills add https://github.com/thincher/awsome_skills --skill glm-understand-image

Agent 安装分布

amp 2

cline 2

openclaw 2

opencode 2

cursor 2

kimi-cli 2

Skill 文档

glm-understand-image

ä½¿ç¨ GLM è§è§ MCP æå¡å¨è¿è¡å¾åçè§£ååæã

æ§è¡æµç¨ï¼é¦æ¬¡éè¦å®è£ï¼åç»ç´æ¥æ¥éª¤6è°ç¨ï¼

æ¥éª¤ 1: æ£æ¥å¹¶å®è£ä¾èµ

1.1 æ£æ¥ mcporter æ¯å¦å¯ç¨

npx -y mcporter --version

å¦æå½ä»¤è¿åæåï¼è¯´æ mcporter å¯ç¨ï¼è·³å°æ¥éª¤ 2ã

mcporter å¯ä»¥ç´æ¥éè¿ npx ä½¿ç¨ï¼æ éå®è£ã

æ¥éª¤ 2: æ£æ¥ API Key éç½®

cat ~/.openclaw/config/glm.json 2>/dev/null | python3 -c "import json,sys; d=json.load(sys.stdin); print(d.get('api_key', ''))"

å¦æè¿åéç©ºç API Keyï¼è·³å°æ¥éª¤ 4ã

æ¥éª¤ 3: éç½® API Keyï¼å¦ææªéç½®ï¼

3.2 å¦ææ²¡ææ¾å° Keyï¼åç¨æ·ç´¢è¦

è¯¢é®ç¨æ·æä¾æºè°± API Keyã

å¦æç¨æ·æ²¡ææºè°± API Keyï¼å¯ä»¥è®¿é® https://www.bigmodel.cn/glm-coding?ic=OOKF4KGGTW è´ä¹°ã

3.3 ä¿å API Key

mkdir -p ~/.openclaw/config
cat > ~/.openclaw/config/glm.json << EOF
{
  "api_key": "APIå¯é¥"
}
EOF

æ¥éª¤ 4: æ·»å MCP æå¡å¨

ä½¿ç¨ mcporter æ·»å GLM è§è§ MCP æå¡å¨ï¼

mcporter config add glm-vision \
  --command "npx -y @z_ai/mcp-server" \
  --env Z_AI_API_KEY="your-key" \
  --env Z_AI_MODE="ZHIPU" \
  --env HOME="$PWD"

æ¥éª¤ 5: æµè¯è¿æ¥

mcporter list

ç¡®è®¤ glm-vision æå¡å¨å·²æåæ·»å ã

æ¥éª¤ 6: ä½¿ç¨ MCP å¤çå¾å

6.1 åå¤å¾ç

å°å¾çæ¾å°å¯è®¿é®è·¯å¾ï¼ä¾å¦ï¼

~/.openclaw/workspace/images/å¾çå.jpg
æèä½¿ç¨ URL

6.2 ä½¿ç¨ mcporter è°ç¨ MCP å·¥å·

ä½¿ç¨ mcporter è°ç¨ MCP æå¡ï¼

mcporter call glm-vision.analyze_image prompt="<å¯¹å¾ççæé®>" image_source="<å¾çè·¯å¾æURL>"

ç¤ºä¾ï¼

# æè¿°å¾çåå®¹
mcporter call glm-vision.analyze_image prompt="è¯¦ç»æè¿°è¿å¼ å¾ççåå®¹" image_source="~/image.jpg"

# ä½¿ç¨ URL
mcporter call glm-vision.analyze_image prompt="è¿å¼ å¾çå±ç¤ºäºä»ä¹ï¼" image_source="https://example.com/image.jpg"

# æåå¾çä¸çæå
mcporter call glm-vision.extract_text_from_screenshot image_source="~/screenshot.png"

# è¯æéè¯¯æªå¾
mcporter call glm-vision.diagnose_error_screenshot prompt="åæè¿ä¸ªéè¯¯" image_source="~/error.png"

6.3 API åæ°è¯´æ

åæ°	è¯´æ	ç±»å
image_source	å¾çè·¯å¾æ URL	string (å¿å¡«)
prompt	å¯¹å¾ççæé®	string (å¿å¡«)

æ¯æçå·¥å·

éè¦æç¤ºï¼å¦æåºç°é®é¢ä»¥å®æ¹è¯´æä¸ºå å®æ¹çè¯´æ ï¼ https://docs.bigmodel.cn/cn/coding-plan/mcp/vision-mcp-server

GLM è§è§ MCP æå¡å¨æä¾ä»¥ä¸å·¥å·ï¼

ui_to_artifact – å° UI æªå¾è½¬æ¢ä¸ºä»£ç ãæç¤ºè¯ãè®¾è®¡è§èæèªç¶è¯è¨æè¿°
extract_text_from_screenshot – ä½¿ç¨åè¿ç OCR è½åä»æªå¾ä¸æååè¯å«æå
diagnose_error_screenshot – è§£æéè¯¯å¼¹çªãå æ åæ¥å¿æªå¾ï¼ç»åºå®ä½ä¸ä¿®å¤å»ºè®®
understand_technical_diagram – éå¯¹æ¶æå¾ãæµç¨å¾ãUMLãER å¾çææ¯å¾çº¸çæç»æåè§£è¯»
analyze_data_visualization – éè¯»ä»ªè¡¨çãç»è®¡å¾è¡¨ï¼æç¼è¶å¿ãå¼å¸¸ä¸ä¸å¡è¦ç¹
ui_diff_check – å¯¹æ¯ä¸¤å¼ UI æªå¾ï¼è¯å«è§è§å·®å¼åå®ç°åå·®
analyze_image – éç¨å¾åçè§£è½åï¼ééæªè¢«ä¸é¡¹å·¥å·è¦ççè§è§åå®¹
video_analysis – æ¯æ MP4/MOV/M4V çæ ¼å¼çè§é¢åºæ¯è§£æï¼æåå³é®å¸§ãäºä»¶ä¸è¦ç¹

MCP éç½®

MCP æå¡å¨åç§°ï¼glm-vision

MCP æå¡å¨éç½®ï¼@z_ai/mcp-server

ç¯å¢åéï¼

Z_AI_API_KEY – æºè°± API Keyï¼å¿éï¼

GitHub 仓库 ↗ ← 返回陌讯 Skills 聚合平台

glm-understand-image

Agent 安装分布

Skill 文档

glm-understand-image

æ§è¡æµç¨ï¼é¦æ¬¡éè¦å®è£ ï¼åç»­ç´æ¥æ­¥éª¤6è°ç¨ï¼

æ­¥éª¤ 1: æ£æ¥å¹¶å®è£ ä¾èµ

1.1 æ£æ¥ mcporter æ¯å¦å¯ç¨

æ­¥éª¤ 2: æ£æ¥ API Key é ç½®

æ­¥éª¤ 3: é ç½® API Keyï¼å¦ææªé ç½®ï¼

3.2 å¦ææ²¡ææ¾å° Keyï¼åç¨æ·ç´¢è¦

3.3 ä¿å­ API Key

æ­¥éª¤ 4: æ·»å MCP æå¡å¨

æ­¥éª¤ 5: æµè¯è¿æ¥

æ­¥éª¤ 6: ä½¿ç¨ MCP å¤çå¾å

6.1 åå¤å¾ç

6.2 ä½¿ç¨ mcporter è°ç¨ MCP å·¥å ·

6.3 API åæ°è¯´æ

æ¯æçå·¥å ·

MCP é ç½®

æ§è¡æµç¨ï¼é¦æ¬¡éè¦å®è£ï¼åç»ç´æ¥æ¥éª¤6è°ç¨ï¼

æ¥éª¤ 1: æ£æ¥å¹¶å®è£ä¾èµ

1.1 æ£æ¥ mcporter æ¯å¦å¯ç¨

æ¥éª¤ 2: æ£æ¥ API Key éç½®

æ¥éª¤ 3: éç½® API Keyï¼å¦ææªéç½®ï¼

3.2 å¦ææ²¡ææ¾å° Keyï¼åç¨æ·ç´¢è¦

3.3 ä¿å API Key

æ¥éª¤ 4: æ·»å MCP æå¡å¨

æ¥éª¤ 5: æµè¯è¿æ¥

æ¥éª¤ 6: ä½¿ç¨ MCP å¤çå¾å

6.1 åå¤å¾ç

6.2 ä½¿ç¨ mcporter è°ç¨ MCP å·¥å·

6.3 API åæ°è¯´æ

æ¯æçå·¥å·

MCP éç½®