docs-to-notebooklm

📁 zstmfhy/docs-to-notebooklm 📅 12 days ago

总安装量

周安装量

#67820

全站排名

安装命令

npx skills add https://github.com/zstmfhy/docs-to-notebooklm --skill docs-to-notebooklm

Agent 安装分布

claude-code 1

antigravity 1

gemini-cli 1

Skill 文档

Docs to NotebookLM

ä»åç§ææ¯ææ¡£ç½ç«æ¹éæååå®¹å¹¶åæ¥å° Google NotebookLM çå·¥å·éã

åè½ç¹æ§

ð å¤æ¡æ¶æ¯æ: VitePress, Docusaurus, GitBook, VuePress
ð¤ æºè½æå: èªå¨è¯å«ææ¡£ç»æï¼æåçº¯ææ¬
ð¦ èªå¨åæ¹: NotebookLM éå¶ 50 æä»¶/ç¬è®°æ¬ï¼èªå¨åå»ºå¤ä¸ª
ð å¢éåæ¥: æ¯ææç¹ç»ä¼ åè¿åº¦ä¿å
ð¯ ç²¾åæå: Playwright å¤çå¨æå è½½é¡µé¢

å¿«éå¼å§

å®è£ä¾èµ

pip install playwright beautifulsoup4 html2text
playwright install chromium
npm install -g @notebooklm/cli
notebooklm login

åºæ¬ä½¿ç¨

# 1. æåææ¡£é¾æ¥
python scripts/extract_sidebar_iterative.py "https://docs.example.com" \
    --output links.json --delay 1.5

# 2. ä¸è½½ä¸º Markdown
python scripts/download_markdown.py --input links.json \
    --output docs/ --delay 2.0

# 3. ä¸ä¼ å° NotebookLM
python scripts/upload_markdown_to_notebooklm.py --input docs/ \
    --notebook "ææ¯ææ¡£" --yes

èæ¬è¯´æ

extract_sidebar_iterative.py

æåææ¡£ç½ç«çå¯¼èªé¾æ¥ã

python scripts/extract_sidebar_iterative.py <start_url> \
    --output links.json \
    --delay 1.5 \
    --max-pages 1000

åæ°:

start_url: ææ¡£ç½ç«èµ·å§ URL
--output: è¾åºæä»¶è·¯å¾ï¼JSON æ ¼å¼ï¼
--delay: é¡µé¢å è½½å»¶è¿ï¼ç§ï¼ï¼é»è®¤ 1.0
--max-pages: æå¤§æåé¡µé¢æ°ï¼é»è®¤ 1000
--headless: æ å¤´æ¨¡å¼è¿è¡
--cookie: æ·»å è®¤è¯ cookie

è¾åº:

links.json: ææææ¡£é¾æ¥
links.txt: ææ¬æ ¼å¼é¾æ¥åè¡¨
extract_progress.json: è¿åº¦æä»¶ï¼æ¯ææç¹ç»ä¼ ï¼

download_markdown.py

ä¸è½½ææ¡£é¡µé¢å¹¶è½¬æ¢ä¸º Markdownã

python scripts/download_markdown.py \
    --input links.json \
    --output docs/ \
    --delay 2.0

åæ°:

--input: é¾æ¥æä»¶ï¼JSON æ TXT æ ¼å¼ï¼
--output: è¾åºç®å½
--delay: è¯·æ±å»¶è¿ï¼ç§ï¼ï¼é»è®¤ 1.5
--concurrent: å¹¶åæ°ï¼é»è®¤ 1
--max-files: æå¤§ä¸è½½æ°é

è¾åº:

docs/: Markdown æä»¶ç®å½
README.md: çæçç´¢å¼
download_progress.json: è¿åº¦æä»¶

upload_markdown_to_notebooklm.py

ä¸ä¼ Markdown æä»¶å° NotebookLMã

python scripts/upload_markdown_to_notebooklm.py \
    --input docs/ \
    --notebook "æçææ¡£" \
    --yes \
    --batch-size 50

åæ°:

--input: è¾å¥ç®å½
--notebook: ç¬è®°æ¬åç§°
--pattern: æä»¶å¹éæ¨¡å¼ï¼é»è®¤ *.md
--yes: è·³è¿ç¡®è®¤
--delay: ä¸ä¼ å»¶è¿ï¼ç§ï¼ï¼é»è®¤ 0.5
--batch-size: æ¯æ¹æä»¶æ°ï¼æå¤§ 50

ç¹æ§:

èªå¨åæ¹ï¼è¶è¿ 50 æä»¶æ¶åå»ºå¤ä¸ªç¬è®°æ¬
è¿åº¦è·è¸ªï¼æ¯ 10 ä¸ªæä»¶æ¾ç¤ºè¿åº¦
éè¯¯å¤çï¼å¤±è´¥æä»¶ä¿åå° _failed_uploads.txt

ä½¿ç¨ç¤ºä¾

ç¤ºä¾ 1: ç«å±±å¼æ GPU ææ¡£

# æåé¾æ¥
python scripts/extract_sidebar_iterative.py \
    "https://www.volcengine.com/docs/6419/70481?lang=zh" \
    --output volc_links.json

# ä¸è½½ææ¡£
python scripts/download_markdown.py \
    --input volc_links.json \
    --output volc_docs/ \
    --delay 2.0

# ä¸ä¼ ï¼96 ä¸ªæä»¶ â 2 ä¸ªç¬è®°æ¬ï¼
python scripts/upload_markdown_to_notebooklm.py \
    --input volc_docs/ \
    --notebook "ç«å±±å¼æGPUææ¡£" \
    --yes

ç¤ºä¾ 2: éè¦ç»å½çææ¡£

# æ·»å è®¤è¯ cookie
python scripts/extract_sidebar_iterative.py \
    "https://docs.internal.com" \
    --output internal_links.json \
    --cookie "session_id=xxxxx"

ç¤ºä¾ 3: å¤§éææ¡£ï¼èªå¨åæ¹ï¼

# 120 ä¸ªæä»¶ä¼èªå¨åå»º 3 ä¸ªç¬è®°æ¬
python scripts/upload_markdown_to_notebooklm.py \
    --input large_docs/ \
    --notebook "å¤§åææ¡£é" \
    --batch-size 40 \
    --yes

NotebookLM éå¶å¤ç

NotebookLM æ¯ä¸ªç¬è®°æ¬æå¤ 50 ä¸ªæ¥æºã

èªå¨åæ¹é»è¾:

96 ä¸ªæä»¶ Ã· 50 æ¯æ¹ = 2 ä¸ªç¬è®°æ¬

ç¬è®°æ¬ 1: "å¤§åææ¡£é" (50 ä¸ªæä»¶)
ç¬è®°æ¬ 2: "å¤§åææ¡£é (2)" (46 ä¸ªæä»¶)

å¸¸è§é®é¢

Q: Playwright æµè§å¨æªå®è£ï¼

playwright install chromium

Q: æåä¸å°é¾æ¥ï¼

ç§»é¤ --headless éé¡¹æ¥çæµè§å¨è¡ä¸ºï¼

python scripts/extract_sidebar_iterative.py \
    "https://docs.example.com" \
    --output links.json

Q: ä¸ä¼ å¤±è´¥ï¼

æ£æ¥ç»å½ç¶æ: notebooklm status
åå°å»¶è¿: --delay 0.3
æ¥çå¤±è´¥æä»¶: _failed_uploads.txt

Q: æä»¶åå®¹ä¸å®æ´ï¼

å¢å å»¶è¿çå¾ JS å è½½ï¼

python scripts/extract_sidebar_iterative.py \
    "https://docs.example.com" \
    --output links.json \
    --delay 3.0

ææ¯æ

Playwright: æµè§å¨èªå¨åï¼å¤çå¨æåå®¹
BeautifulSoup: HTML è§£æååå®¹æå
html2text: HTML è½¬ Markdown
NotebookLM CLI: ä¸ Google NotebookLM äº¤äº

ä¾èµé¡¹

playwright>=1.40.0
beautifulsoup4>=4.12.0
html2text>=2020.1.16

æä½³å®è·µ

éçéå¶: ä½¿ç¨åççå»¶è¿ï¼1-2 ç§ï¼é¿åè¢«å°
æ¹éå¤ç: å¤§éææ¡£èªå¨åæ¹ï¼æ éæå¨å¹²é¢
è¿åº¦ä¿å: ææèæ¬æ¯ææç¹ç»ä¼
éè¯¯å¤ç: æ£æ¥å¤±è´¥æä»¶åè¡¨å¹¶éè¯

è¾åºæä»¶

é¾æ¥æå

links.json: JSON æ ¼å¼é¾æ¥
links.txt: çº¯ææ¬é¾æ¥
extract_progress.json: è¿åº¦ä¿¡æ¯

ä¸è½½

docs/*.md: Markdown æä»¶
docs/README.md: ç´¢å¼æä»¶
download_progress.json: ä¸è½½è¿åº¦

ä¸ä¼

.notebooklm_info.json: ç¬è®°æ¬ ID
.upload_summary.json: ä¸ä¼ æè¦
_failed_uploads.txt: å¤±è´¥åè¡¨

è®¸å¯è¯

MIT License

GitHub 仓库 ↗ ← 返回陌讯 Skills 聚合平台

docs-to-notebooklm

Agent 安装分布

Skill 文档

Docs to NotebookLM

åè½ç¹æ§

å¿«éå¼å§

å®è£ ä¾èµ

åºæ¬ä½¿ç¨

èæ¬è¯´æ

extract_sidebar_iterative.py

download_markdown.py

upload_markdown_to_notebooklm.py

ä½¿ç¨ç¤ºä¾

ç¤ºä¾ 1: ç«å±±å¼æ GPU ææ¡£

ç¤ºä¾ 2: éè¦ç»å½çææ¡£

ç¤ºä¾ 3: å¤§éææ¡£ï¼èªå¨åæ¹ï¼

NotebookLM éå¶å¤ç

å¸¸è§é®é¢

Q: Playwright æµè§å¨æªå®è£ ï¼

Q: æåä¸å°é¾æ¥ï¼

Q: ä¸ä¼ å¤±è´¥ï¼

Q: æä»¶å å®¹ä¸å®æ´ï¼

ææ¯æ 

ä¾èµé¡¹

æä½³å®è·µ

è¾åºæä»¶

é¾æ¥æå

ä¸è½½

ä¸ä¼

è®¸å¯è¯

åè½ç¹æ§

å¿«éå¼å§

å®è£ä¾èµ

åºæ¬ä½¿ç¨

èæ¬è¯´æ

ä½¿ç¨ç¤ºä¾

ç¤ºä¾ 1: ç«å±±å¼æ GPU ææ¡£

ç¤ºä¾ 2: éè¦ç»å½çææ¡£

ç¤ºä¾ 3: å¤§éææ¡£ï¼èªå¨åæ¹ï¼

NotebookLM éå¶å¤ç

å¸¸è§é®é¢

Q: Playwright æµè§å¨æªå®è£ï¼

Q: æåä¸å°é¾æ¥ï¼

Q: ä¸ä¼ å¤±è´¥ï¼

Q: æä»¶åå®¹ä¸å®æ´ï¼

ææ¯æ

ä¾èµé¡¹

æä½³å®è·µ

è¾åºæä»¶

é¾æ¥æå

ä¸è½½

ä¸ä¼

è®¸å¯è¯