funasr-transcribe

📁 cat-xierluo/legal-skills 📅 9 days ago

总安装量

周安装量

#33524

全站排名

安装命令

npx skills add https://github.com/cat-xierluo/legal-skills --skill funasr-transcribe

Agent 安装分布

claude-code 8

codex 7

gemini-cli 7

cursor 7

opencode 7

trae 6

Skill 文档

FunASR è¯é³è½¬æå

åè½æ¦è¿°

æ¯æå¤ç§é³è§é¢æ ¼å¼ï¼mp4ãmovãmp3ãwavãm4aãflac çï¼
èªå¨çææ¶é´æ³
æ¯æè¯´è¯äººåç¦»ï¼diarizationï¼
è¾åº Markdown æ ¼å¼ï¼ä¾¿äºéè¯»åç¼è¾

ä½¿ç¨æµç¨

é¦æ¬¡ä½¿ç¨ï¼å®è£ä¾èµåä¸è½½æ¨¡å

è¿è¡å®è£èæ¬å®æç¯å¢éç½®ï¼

python scripts/setup.py

å®è£èæ¬ä¼èªå¨ï¼

æ£æ¥ Python çæ¬ï¼éè¦ >= 3.8ï¼
å®è£ä¾èµåï¼FastAPIãUvicornãFunASRãPyTorchï¼
ä¸è½½ ASR æ¨¡åå° ~/.cache/modelscope/hub/models/

éªè¯å®è£ç¶æï¼

python scripts/setup.py --verify

å¯å¨è½¬å½æå¡

python scripts/server.py

æå¡é»è®¤è¿è¡å¨ http://127.0.0.1:8765

æºè½ç¹æ§ï¼

èªå¨å¯å¨ï¼é¦æ¬¡è¯·æ±æ¶èªå¨å è½½æ¨¡å
ç©ºé²å³éï¼é»è®¤ 10 åéæ æ´»å¨åèªå¨å³éä»¥èçº¦èµæº
å¯éç½®è¶æ¶ï¼ä½¿ç¨ --idle-timeout åæ°èªå®ä¹ç©ºé²è¶æ¶æ¶é´ï¼ç§ï¼

æå¡çå½å¨æï¼

å¯å¨åè¿å¥ç©ºé²çæ§ç¶æ
æ¥æ¶å°è¯·æ±æ¶èªå¨å è½½æ¨¡åå¹¶æ§è¡è½¬å½
æ¯æ¬¡è¯·æ±é½ä¼éç½®ç©ºé²è®¡æ¶å¨
è¿ç» 10 åéæ è¯·æ±æ¶èªå¨å³é
ä¸æ¬¡è¯·æ±æ¶éæ°å¯å¨

éè¦æç¤ºï¼

â ï¸ è¯·å¿æå¨å³éæå¡ – è½¬å½å®æåè®©æå¡ç»§ç»è¿è¡ï¼å®ä¼èªå¨å¨ 10 åéæ æ´»å¨åå³é
è¿æ ·å¯ä»¥è¿ç»è½¬å½å¤ä¸ªæä»¶ï¼æ ééå¤å¯å¨æå¡
å¦éç«å³å³éæå¡ï¼æ Ctrl+C æçå¾ 10 åéç©ºé²è¶æ¶

ç¤ºä¾ï¼èªå®ä¹ 30 åéç©ºé²è¶æ¶

python scripts/server.py --idle-timeout 1800

æ§è¡è½¬å½

ä½¿ç¨å®¢æ·ç«¯èæ¬è½¬å½æä»¶ï¼

# è½¬å½åä¸ªæä»¶
python scripts/transcribe.py /path/to/audio.mp3

# æå®è¾åºè·¯å¾
python scripts/transcribe.py /path/to/video.mp4 -o transcript.md

# å¯ç¨è¯´è¯äººåç¦»
python scripts/transcribe.py /path/to/meeting.m4a --diarize

# æ¹éè½¬å½ç®å½
python scripts/transcribe.py /path/to/media_folder/

AI æºè½æ»ç»ï¼Claude Code ç¯å¢ï¼

è½¬å½å®æåï¼å¯ä»¥çæ AI æºè½æ»ç»ï¼ååå©ç¨ Claude Code çåç AI è½åã

å·¥ä½æµç¨ï¼

æ§è¡è½¬å½åï¼èæ¬ä¼èªå¨åå¤æ»ç»æç¤ºè¯
å°æç¤ºè¯åéç» Claude AI çæç»æåæ»ç»
å° Claude è¿åç JSON ç»æç²è´´åèæ¬
èªå¨å°æ»ç»æ³¨å¥å° Markdown æä»¶

ä½¿ç¨æ¹æ³ï¼

# è½¬å½åä¸ªæä»¶ï¼ä¼èªå¨æç¤ºæ¯å¦çææ»ç»ï¼
python scripts/transcribe.py /path/to/audio.mp3

# å¯ç¨è¯´è¯äººåç¦»å¹¶çææ»ç»
python scripts/transcribe.py /path/to/meeting.m4a --diarize --summary

æ»ç»åå®¹ç»æï¼

å¨ææ»ç» – 400+ åï¼åå«èæ¯ãé®é¢ãå³é®äºå®
åè¨äººæ»ç» – æ¯ä¸ªåè¨äººçè§ç¹ãæåº¦åè´¡ç®
éç¹åå®¹ – 6-10 æ¡æ ¸å¿è¦ç¹
å³é®è¯ – 5-8 ä¸ªå³é®æ¯è¯

æç¤ºè¯ç¹ç¹ï¼

ä¸é¨éå¯¹ä¸æå£è¯åå¯¹è¯ä¼å
ä¿çåè¨äººä¸ä¸æåå¯¹è¯æµç¨
ç»æå JSON è¾åºä¾¿äºè§£æåæ ¼å¼å

è¯¦ç»ææ¡£è¯·æ¥çï¼<references/api-reference.md>

éè¿ HTTP API è°ç¨

æ£æ¥æå¡ç¶æï¼

curl http://127.0.0.1:8765/health

ä½¿ç¨ curl ç´æ¥è°ç¨ APIï¼

curl -X POST http://127.0.0.1:8765/transcribe \
  -H "Content-Type: application/json" \
  -d '{"file_path": "/path/to/audio.mp3"}'

API ææ¡£ï¼Swagger UIï¼ï¼

FastAPI èªå¨çæäº¤äºå¼ API ææ¡£ï¼è®¿é®ï¼http://127.0.0.1:8765/docs

å¯å¨æ¤é¡µé¢ä¸ï¼

æ¥çææ API ç«¯ç¹
å¨çº¿æµè¯ APIï¼ä¸éè¦ curlï¼
æ¥çè¯·æ±/ååºæ ¼å¼
æ¥çè¯¦ç»åæ°è¯´æ

ååºç¤ºä¾ï¼å¥åº·æ£æ¥ï¼ï¼

{
  "status": "ok",
  "service": "FunASR Transcribe",
  "uptime": 300,
  "idle_time": 120
}

è¿ååæ®µè¯´æï¼

uptimeï¼æå¡è¿è¡æ¶é´ï¼ç§ï¼
idle_timeï¼å½åç©ºé²æ¶é´ï¼ç§ï¼

å®æ´ API ææ¡£

è¯¦ç»ç API åèææ¡£è¯·æ¥çï¼<references/api-reference.md>

åå«ï¼

ææ API ç«¯ç¹çå®æ´è§è
è¯·æ±/ååºæ ¼å¼è¯¦è§£
åæ°è¯´æåç¤ºä¾
å®æ´ç curl å½ä»¤ç¤ºä¾

èæ¬è¯´æ

èæ¬	ç¨é
`scripts/setup.py`	ä¸é®å®è£ä¾èµåä¸è½½æ¨¡å
`scripts/server.py`	å¯å¨ HTTP API æå¡
`scripts/transcribe.py`	å½ä»¤è¡å®¢æ·ç«¯ï¼Claude Code ç¨ï¼
`scripts/auto_transcribe.py`	èªå¨åè½¬å½èæ¬ï¼æ¨èï¼

OpenClaw èªå¨è½¬å½ + æ»ç»æµç¨

æ¹å¼ä¸ï¼ä½¿ç¨èªå¨åèæ¬ï¼æ¨èï¼

# èªå¨è½¬å½ + è·åæ»ç»æç¤ºè¯
python scripts/auto_transcribe.py /path/to/audio.aac

# èªå¨è½¬å½ + è¯´è¯äººåç¦»
python scripts/auto_transcribe.py /path/to/audio.aac --diarize

# åªè·åæ»ç»æç¤ºè¯ï¼ä¸çææ»ç»
python scripts/auto_transcribe.py /path/to/audio.aac --prompt-only

æ¹å¼äºï¼HTTP API è°ç¨

1. è½¬å½é³é¢

curl -X POST http://127.0.0.1:8765/transcribe \
  -H "Content-Type: application/json" \
  -d '{"file_path": "/path/to/audio.aac"}'

2. è·åæ»ç»æç¤ºè¯

curl -X POST http://127.0.0.1:8765/summary \
  -H "Content-Type: application/json" \
  -d '{"md_path": "/path/to/audio.md"}'

ååºç¤ºä¾ï¼

{
  "success": true,
  "output_path": "/path/to/audio.md",
  "summary_prompt": "ä½ æ¯ä¸ä½æé¿å¤çå£è¯åä¸æå¯¹è¯...",
  "text_preview": "è½¬å½ææ¬å500å..."
}

3. æ³¨å¥ AI æ»ç»

å¨ Agentï¼OpenClawï¼ä¸çææ»ç»åï¼è°ç¨ï¼

curl -X POST http://127.0.0.1:8765/inject_summary \
  -H "Content-Type: application/json" \
  -d '{
    "md_path": "/path/to/audio.md",
    "summary_content": "## AI æè¦\n\n### å¨ææ»ç»\n...\n\n### éç¹åå®¹\n- ...\n\n### å³é®è¯\n..."
  }'

å®æ´æµç¨ç¤ºä¾ï¼OpenClawï¼

ç¨æ·ï¼è½¬å½è¿ä¸ªé³é¢
  â
Agentï¼
  1. curl -X POST /transcribe -d '{"file_path": "xxx.aac"}'
  2. curl -X POST /summary -d '{"md_path": "xxx.md"}'
  3. ç¨æ¨¡åçææ»ç»
  4. curl -X POST /inject_summary -d '{"md_path": "xxx.md", "summary_content": "..."}'
  â
ç¨æ·ï¼æ¶å°å¸¦æ»ç»ç Markdown æä»¶

API ç«¯ç¹æ±æ»

ç«¯ç¹	æ¹æ³	åè½
`/health`	GET	å¥åº·æ£æ¥
`/transcribe`	POST	è½¬å½é³é¢/è§é¢
`/batch_transcribe`	POST	æ¹éè½¬å½ç®å½
`/summary`	POST	çæ AI æ»ç»æç¤ºè¯
`/inject_summary`	POST	å°æ»ç»æ³¨å¥ Markdown æä»¶

ç¯å¢æ£æµ

server.py ä¼èªå¨æ£æµè¿è¡ç¯å¢ï¼

OpenClaw: æ£æµ OPENCLAW_SERVICE_MARKER=openclaw ç¯å¢åé
Claude Code: æ£æµ CLAUDE_API_KEY æ ANTHROPIC_API_KEY ç¯å¢åé

éç½®æä»¶

æä»¶	è¯´æ
`assets/models.json`	ASR æ¨¡åéç½®æ¸å
`assets/requirements.txt`	Python ä¾èµæ¸å

è¾åºæ ¼å¼

è½¬å½ç»æä¿åä¸º Markdown æä»¶ï¼åå«ï¼

æ é¢ – æä»¶åï¼æ è½¬å½æ¶é´æ³ï¼
è½¬å½åå®¹ – æ ¼å¼ï¼åè¨äººN HH:MM:SS æ¢è¡ åå®¹
AI æè¦ï¼å¯éï¼- åå«å¨ææ»ç»ãåè¨äººæ»ç»ãéç¹åå®¹ãå³é®è¯

ç¤ºä¾æ ¼å¼ï¼

# è½¬å½ï¼filename.mp4

## è½¬å½åå®¹

åè¨äºº1 00:00:01
è¿æ¯ç¬¬ä¸å¥è¯çåå®¹ã

åè¨äºº2 00:00:05
è¿æ¯ç¬¬äºå¥è¯çåå®¹ã

æ¨¡åä¿¡æ¯

æ¨¡ååå¨å¨ ModelScope é»è®¤ç¼åç®å½ ~/.cache/modelscope/hub/models/ï¼

ASR ä¸»æ¨¡å (Paraformer) – 867MB
VAD æ¨¡å – 4MB
æ ç¹æ¨¡å – 283MB
è¯´è¯äººåç¦»æ¨¡å – 28MB

æéæé¤

æå¡å¯å¨å¤±è´¥æ¶ï¼è¿è¡éªè¯å½ä»¤æ£æ¥å®è£ç¶æï¼

python scripts/setup.py --verify

éæ°ä¸è½½æ¨¡åï¼

python scripts/setup.py --skip-deps

GitHub 仓库 ↗ ← 返回陌讯 Skills 聚合平台

funasr-transcribe

Agent 安装分布

Skill 文档

FunASR è¯­é³è½¬æå­

åè½æ¦è¿°

ä½¿ç¨æµç¨

é¦æ¬¡ä½¿ç¨ï¼å®è£ ä¾èµåä¸è½½æ¨¡å

å¯å¨è½¬å½æå¡

æ§è¡è½¬å½

AI æºè½æ»ç»ï¼Claude Code ç¯å¢ï¼

éè¿ HTTP API è°ç¨

å®æ´ API ææ¡£

èæ¬è¯´æ

OpenClaw èªå¨è½¬å½ + æ»ç»æµç¨

æ¹å¼ä¸ï¼ä½¿ç¨èªå¨åèæ¬ï¼æ¨èï¼

æ¹å¼äºï¼HTTP API è°ç¨

1. è½¬å½é³é¢

2. è·åæ»ç»æç¤ºè¯

3. æ³¨å ¥ AI æ»ç»

å®æ´æµç¨ç¤ºä¾ï¼OpenClawï¼

API ç«¯ç¹æ±æ»

ç¯å¢æ£æµ

é ç½®æä»¶

è¾åºæ ¼å¼

æ¨¡åä¿¡æ¯

æ éæé¤