pdf-ocr

📁 yejinlei/pdf-ocr-skill 📅 1 day ago

总安装量

周安装量

#61234

全站排名

安装命令

npx skills add https://github.com/yejinlei/pdf-ocr-skill --skill pdf-ocr

Agent 安装分布

gemini-cli 3

codebuddy 3

github-copilot 3

codex 3

kimi-cli 3

cursor 3

Skill 文档

PDF OCR Skill

åè½ç¹æ§

æ¯æå½±å°çPDFæä»¶çæåæå
æ¯æå¤ç§å¾çæ ¼å¼çæåè¯å«ï¼JPGãPNGãBMPãGIFãTIFFãWEBPï¼
ä½¿ç¨ç¡åºæµå¨å¤§æ¨¡åè¿è¡OCRè¯å«
æ¯æä¸æåè±ææåè¯å«
ä¿ææåçé¡ºåºåç»æ
èªå¨å°PDFé¡µé¢è½¬æ¢ä¸ºå¾çè¿è¡è¯å«

å®è£

ä¾èµè¦æ±

pip install pymupdf pillow requests python-dotenv

ç¯å¢åééç½®

å¤å¶ .env.example æä»¶å¹¶éå½åä¸º .env
å¡«å¥æ¨çç¡åºæµå¨ API å¯é¥ï¼

SILICON_FLOW_API_KEY=your_api_key_here
SILICON_FLOW_OCR_MODEL=deepseek-ai/DeepSeek-OCR

å¿«éå¼å§

è¯å«PDFæä»¶

# å¯¼å¥OCRå¤çå¨
from pdf_ocr_processor import PDFOCRProcessor

# åå»ºå¤çå¨å®ä¾
processor = PDFOCRProcessor()

# æ§è¡PDF OCRè¯å«
result = processor.ocr_pdf('path/to/your/scanned.pdf')

# è·åè¯å«ç»æ
print(f"è¯å«å®æï¼å± {result['page_count']} é¡µ")
print(result['text'])

è¯å«å¾çæä»¶

# å¯¼å¥OCRå¤çå¨
from pdf_ocr_processor import PDFOCRProcessor

# åå»ºå¤çå¨å®ä¾
processor = PDFOCRProcessor()

# æ§è¡å¾çOCRè¯å«
result = processor.ocr_image_file('path/to/your/image.jpg')

# è·åè¯å«ç»æ
print(f"è¯å«ç»æ: {result['text']}")

æ¯æçæä»¶æ ¼å¼

PDFæä»¶: .pdf
å¾çæä»¶: .jpg, .jpeg, .png, .bmp, .gif, .tiff, .webp

è¾åºæ ¼å¼

{
    "text": "è¯å«çå®æ´ææ¬åå®¹",
    "page_count": é¡µæ°  # å¾çæä»¶å§ç»ä¸º1
}

ä½¿ç¨åºæ¯

å¤çæ«æçååãåè®®çææ¡£
æåå½±å°çä¹¦ç±ãæ¥åä¸çæå
å¤çæ æ³ç´æ¥å¤å¶æåçPDFæä»¶
æ¹éå¤çæ«æçPDFææ¡£
è¯å«æªå¾ãæ«æä»¶çå¾çä¸çæå
å¤çæåä½æå°å·ä½å¾çæåè¯å«

æ³¨æäºé¡¹

OCRè¯å«éè¦è°ç¨ç¡åºæµå¨APIï¼å¯è½ä¼äº§çè´¹ç¨
è¯å«éåº¦åå³äºæä»¶é¡µæ°ãå¾çå¤§å°åç½ç»ç¶åµ
å¯¹äºå¤æçæ«æçPDFæå¾çï¼è¯å«åç¡®çå¯è½ä¼ææä¸å
å»ºè®®ä½¿ç¨é«æ¸æ°åº¦çæ«æçPDFæå¾çä»¥è·å¾æ´å¥½çè¯å«ææ

è®¸å¯è¯

MIT License – è¯¦è§ LICENSE.txt

GitHub 仓库 ↗ ← 返回陌讯 Skills 聚合平台

pdf-ocr

Agent 安装分布

Skill 文档

PDF OCR Skill

åè½ç¹æ§

å®è£

ä¾èµè¦æ±

ç¯å¢åéé ç½®

å¿«éå¼å§

è¯å«PDFæä»¶

è¯å«å¾çæä»¶

æ¯æçæä»¶æ ¼å¼

è¾åºæ ¼å¼

ä½¿ç¨åºæ¯

æ³¨æäºé¡¹

è®¸å¯è¯