podcastcut-install

📁 luoyuweidu1/podcastcut-skills 📅 7 days ago

总安装量

周安装量

#72857

全站排名

安装命令

npx skills add https://github.com/luoyuweidu1/podcastcut-skills --skill podcastcut-install

Agent 安装分布

amp 2

gemini-cli 2

antigravity 2

codex 2

kimi-cli 2

Skill 文档

å®è£

é¦æ¬¡ä½¿ç¨åçç¯å¢åå¤

å¿«éä½¿ç¨

ç¨æ·: å®è£ç¯å¢
ç¨æ·: åå§å
ç¨æ·: ä¸è½½æ¨¡å

ä¾èµæ¸å

ä¾èµ	ç¨é	å®è£å½ä»¤
funasr	è½¬å½ + å£è¯¯è¯å«	`pip install funasr`
modelscope	æ¨¡åä¸è½½	`pip install modelscope`
ffmpeg	è§é¢åªè¾	`brew install ffmpeg`

æ¨¡åæ¸å

FunASR æ¨¡å

é¦æ¬¡è¿è¡èªå¨ä¸è½½å° ~/.cache/modelscope/ï¼

æ¨¡å	å¤§å°	ç¨é
paraformer-zh	953MB	è¯é³è¯å«ï¼åç¬¦çº§æ¶é´æ³ï¼
punc_ct	1.1GB	æ ç¹é¢æµï¼å¥ååå²ï¼
fsmn-vad	4MB	è¯é³æ´»å¨æ£æµ
cam++	~100MB	è¯´è¯äººåç¦»
æ»è®¡	~2.1GB

ä¸ºä»ä¹ç»ä¸ç¨ FunASRï¼

é¶æ®µ	åè½	è¯´æ
contentï¼åå®¹åªè¾ï¼	è½¬å½ + è¯´è¯äººåç¦» + å¥åæ¶é´æ³	ä¸æ¬¡è°ç¨
transcribeï¼å£è¯¯è¯å«ï¼	è½¬å½ + åç¬¦çº§æ¶é´æ³	30s åæ®µ
subtitleï¼åå¹çæï¼	ç´æ¥ç¨è½¬å½ç»æ

ä¸æè¯å«åç¡®çé«ï¼é¿éä¼åï¼
åç½®è¯´è¯äººåç¦»ï¼cam++ï¼
æ¯æå¥åçº§ååç¬¦çº§æ¶é´æ³
ä¸å¥å·¥å·è§£å³ææé¶æ®µ

å®è£æµç¨

1. å®è£ Python ä¾èµ
       â
2. å®è£ FFmpeg
       â
3. ä¸è½½ FunASR æ¨¡å
       â
4. éªè¯ç¯å¢

æ§è¡æ¥éª¤

1. å®è£ Python ä¾èµ

pip install funasr modelscope

2. å®è£ FFmpeg

# macOS
brew install ffmpeg

# Ubuntu
sudo apt install ffmpeg

# éªè¯
ffmpeg -version

3. ä¸è½½ FunASR æ¨¡åï¼çº¦2.1GBï¼

from funasr import AutoModel

# ä¸è½½å¨é¨æ¨¡åï¼å«è¯´è¯äººåç¦»ï¼
model = AutoModel(
    model="paraformer-zh",
    vad_model="fsmn-vad",
    punc_model="ct-punc",
    spk_model="cam++",  # è¯´è¯äººåç¦»
)
print("FunASR æ¨¡åä¸è½½å®æ")

4. éªè¯ç¯å¢

from funasr import AutoModel

model = AutoModel(
    model="paraformer-zh",
    vad_model="fsmn-vad",
    punc_model="ct-punc",
    spk_model="cam++",
    disable_update=True
)

# æµè¯è½¬å½ï¼ç¨ä»»æé³é¢/è§é¢ï¼
result = model.generate(input="test.mp4", sentence_timestamp=True)
print("ææ¬:", result[0]['text'][:50])
if 'sentence_info' in result[0]:
    print("å¥åæ°:", len(result[0]['sentence_info']))
    # æ£æ¥è¯´è¯äººåç¦»
    spk_ids = set(s.get('spk', 0) for s in result[0]['sentence_info'])
    print("è¯´è¯äººæ°:", len(spk_ids))
print("â ç¯å¢å°±ç»ª")

å¸¸è§é®é¢

Q1: æ¨¡åä¸è½½æ¢

è§£å³ï¼ä½¿ç¨å½åéåææå¨ä¸è½½

Q2: ffmpeg å½ä»¤æ¾ä¸å°

è§£å³ï¼ç¡®è®¤å·²å®è£å¹¶æ·»å å° PATH

which ffmpeg  # åºè¯¥è¾åºè·¯å¾

Q3: funasr å¯¼å¥æ¥é

è§£å³ï¼æ£æ¥ Python çæ¬ï¼éè¦ 3.8+ï¼

python3 --version

GitHub 仓库 ↗ ← 返回陌讯 Skills 聚合平台

podcastcut-install

Agent 安装分布

Skill 文档

å®è£

å¿«éä½¿ç¨

ä¾èµæ¸ å

æ¨¡åæ¸ å

FunASR æ¨¡å

ä¸ºä»ä¹ç»ä¸ç¨ FunASRï¼

å®è£ æµç¨

æ§è¡æ­¥éª¤

1. å®è£ Python ä¾èµ

2. å®è£ FFmpeg

3. ä¸è½½ FunASR æ¨¡åï¼çº¦2.1GBï¼

4. éªè¯ç¯å¢

å¸¸è§é®é¢

Q1: æ¨¡åä¸è½½æ ¢

Q2: ffmpeg å½ä»¤æ¾ä¸å°

Q3: funasr å¯¼å ¥æ¥é