pdf-ocr
3
总安装量
3
周安装量
#61234
全站排名
安装命令
npx skills add https://github.com/yejinlei/pdf-ocr-skill --skill pdf-ocr
Agent 安装分布
gemini-cli
3
codebuddy
3
github-copilot
3
codex
3
kimi-cli
3
cursor
3
Skill 文档
PDF OCR Skill
PDF OCRæè½ç¨äºä»å½±å°çPDFæä»¶åå¾çæä»¶ä¸æåæåå 容ã该æè½ä½¿ç¨ç¡ åºæµå¨å¤§æ¨¡åè¿è¡å å¦å符è¯å«ï¼OCRï¼ï¼è½å¤è¯å«æ«æçPDFåå¾çä¸ç䏿åè±ææåã
åè½ç¹æ§
- æ¯æå½±å°çPDFæä»¶çæåæå
- æ¯æå¤ç§å¾çæ ¼å¼çæåè¯å«ï¼JPGãPNGãBMPãGIFãTIFFãWEBPï¼
- 使ç¨ç¡ åºæµå¨å¤§æ¨¡åè¿è¡OCRè¯å«
- æ¯æä¸æåè±ææåè¯å«
- ä¿ææåç顺åºåç»æ
- èªå¨å°PDF页é¢è½¬æ¢ä¸ºå¾çè¿è¡è¯å«
å®è£
ä¾èµè¦æ±
pip install pymupdf pillow requests python-dotenv
ç¯å¢åéé ç½®
- å¤å¶
.env.exampleæä»¶å¹¶éå½å为.env - å¡«å ¥æ¨çç¡ åºæµå¨ API å¯é¥ï¼
SILICON_FLOW_API_KEY=your_api_key_here
SILICON_FLOW_OCR_MODEL=deepseek-ai/DeepSeek-OCR
å¿«éå¼å§
è¯å«PDFæä»¶
# 导å
¥OCRå¤çå¨
from pdf_ocr_processor import PDFOCRProcessor
# å建å¤çå¨å®ä¾
processor = PDFOCRProcessor()
# æ§è¡PDF OCRè¯å«
result = processor.ocr_pdf('path/to/your/scanned.pdf')
# è·åè¯å«ç»æ
print(f"è¯å«å®æï¼å
± {result['page_count']} 页")
print(result['text'])
è¯å«å¾çæä»¶
# 导å
¥OCRå¤çå¨
from pdf_ocr_processor import PDFOCRProcessor
# å建å¤çå¨å®ä¾
processor = PDFOCRProcessor()
# æ§è¡å¾çOCRè¯å«
result = processor.ocr_image_file('path/to/your/image.jpg')
# è·åè¯å«ç»æ
print(f"è¯å«ç»æ: {result['text']}")
æ¯æçæä»¶æ ¼å¼
- PDFæä»¶: .pdf
- å¾çæä»¶: .jpg, .jpeg, .png, .bmp, .gif, .tiff, .webp
è¾åºæ ¼å¼
{
"text": "è¯å«ç宿´ææ¬å
容",
"page_count": é¡µæ° # å¾çæä»¶å§ç»ä¸º1
}
使ç¨åºæ¯
- å¤çæ«æçååãåè®®çææ¡£
- æåå½±å°ç书ç±ãæ¥åä¸çæå
- å¤çæ æ³ç´æ¥å¤å¶æåçPDFæä»¶
- æ¹éå¤çæ«æçPDFææ¡£
- è¯å«æªå¾ãæ«æä»¶çå¾çä¸çæå
- å¤çæå使å°å·ä½å¾çæåè¯å«
注æäºé¡¹
- OCRè¯å«éè¦è°ç¨ç¡ åºæµå¨APIï¼å¯è½ä¼äº§çè´¹ç¨
- è¯å«é度åå³äºæä»¶é¡µæ°ãå¾ç大å°åç½ç»ç¶åµ
- 对äºå¤æçæ«æçPDFæå¾çï¼è¯å«åç¡®çå¯è½ä¼ææä¸å
- 建议使ç¨é«æ¸ æ°åº¦çæ«æçPDFæå¾ç以è·å¾æ´å¥½çè¯å«ææ
许å¯è¯
MIT License – è¯¦è§ LICENSE.txt