docx

📁 yamato-snow/skills 📅 13 days ago

总安装量

周安装量

#67935

全站排名

安装命令

npx skills add https://github.com/yamato-snow/skills --skill docx

Agent 安装分布

opencode 2

antigravity 2

claude-code 2

github-copilot 2

codex 2

kimi-cli 2

Skill 文档

DOCXã®ä½æãç·¨éãåæ

æ¦è¦

ã¯ã¼ã¯ããã¼æ±ºå®ããªã¼

ã³ã³ãã³ãã®èªã¿åã/åæ

æ°è¦ããã¥ã¡ã³ãã®ä½æ

ãæ°è¦Wordããã¥ã¡ã³ãã®ä½æãã¯ã¼ã¯ããã¼ãä½¿ç¨

æ¢åããã¥ã¡ã³ãã®ç·¨é

èªåã®ããã¥ã¡ã³ã + ç°¡åãªå¤æ´ ãåºæ¬çãªOOXMLç·¨éãã¯ã¼ã¯ããã¼ãä½¿ç¨
ä»èã®ããã¥ã¡ã³ã **ãã¬ããã©ã¤ã³ã¯ã¼ã¯ããã¼ã**ãä½¿ç¨ï¼æ¨å¥¨ããã©ã«ãï¼
æ³åãå¦è¡ããã¸ãã¹ãã¾ãã¯æ¿åºææ¸ **ãã¬ããã©ã¤ã³ã¯ã¼ã¯ããã¼ã**ãä½¿ç¨ï¼å¿é ï¼

ã³ã³ãã³ãã®èªã¿åãã¨åæ

ããã¹ãæ½åº

# å¤æ´å±¥æ´ä»ãã§ããã¥ã¡ã³ããmarkdownã«å¤æ
pandoc --track-changes=all path-to-file.docx -o output.md
# ãªãã·ã§ã³: --track-changes=accept/reject/all

Raw XMLã¢ã¯ã»ã¹

ãã¡ã¤ã«ã®å±é

python ooxml/scripts/unpack.py <office_file> <output_directory>

ä¸»è¦ãªãã¡ã¤ã«æ§é

word/document.xml – ã¡ã¤ã³ããã¥ã¡ã³ãã³ã³ãã³ã
word/comments.xml – document.xmlã§åç§ãããã³ã¡ã³ã
word/media/ – åãè¾¼ã¾ããç»åã¨ã¡ãã£ã¢ãã¡ã¤ã«
å¤æ´å±¥æ´ã¯<w:ins>ï¼æ¿å¥ï¼ã¨<w:del>ï¼åé¤ï¼ã¿ã°ãä½¿ç¨

æ°è¦Wordããã¥ã¡ã³ãã®ä½æ

æ°è¦Wordããã¥ã¡ã³ããã¼ãããä½æããå ´åã¯ãJavaScript/TypeScriptã§Wordããã¥ã¡ã³ããä½æã§ããdocx-jsãä½¿ç¨ãã¾ãã

ã¯ã¼ã¯ããã¼

å¿é – ãã¡ã¤ã«å¨ä½ãèªã: docx-js.mdï¼ç´500è¡ï¼ãæåããæå¾ã¾ã§å®å¨ã«èªãã§ãã ããããã®ãã¡ã¤ã«ãèªãéã«ç¯å²å¶éãè¨å®ããªãã§ãã ããã ããã¥ã¡ã³ãä½æãé²ããåã«ãè©³ç´°ãªæ§æãéè¦ãªæ¸å¼è¨å®ã«ã¼ã«ããã¹ããã©ã¯ãã£ã¹ã®ããã«ãã¡ã¤ã«å¨ä½ãèªãã§ãã ããã
DocumentãParagraphãTextRunã³ã³ãã¼ãã³ããä½¿ç¨ãã¦JavaScript/TypeScriptãã¡ã¤ã«ãä½æï¼ãã¹ã¦ã®ä¾åé¢ä¿ãã¤ã³ã¹ãã¼ã«ããã¦ããã¨ä»®å®ãã¾ãããã¤ã³ã¹ãã¼ã«ããã¦ããªãå ´åã¯ä¸è¨ã®ä¾åé¢ä¿ã»ã¯ã·ã§ã³ãåç§ï¼
Packer.toBuffer()ãä½¿ç¨ãã¦.docxã¨ãã¦ã¨ã¯ã¹ãã¼ã

æ¢åWordããã¥ã¡ã³ãã®ç·¨é

ã¯ã¼ã¯ããã¼

å¿é – ãã¡ã¤ã«å¨ä½ãèªã: ooxml.mdï¼ç´600è¡ï¼ãæåããæå¾ã¾ã§å®å¨ã«èªãã§ãã ããããã®ãã¡ã¤ã«ãèªãéã«ç¯å²å¶éãè¨å®ããªãã§ãã ããã ããã¥ã¡ã³ããã¡ã¤ã«ãç´æ¥ç·¨éããããã®Documentã©ã¤ãã©ãªAPIã¨XMLãã¿ã¼ã³ã«ã¤ãã¦ãã¡ã¤ã«å¨ä½ãèªãã§ãã ããã
ããã¥ã¡ã³ããå±é: python ooxml/scripts/unpack.py <office_file> <output_directory>
Documentã©ã¤ãã©ãªãä½¿ç¨ãã¦Pythonã¹ã¯ãªãããä½æã»å®è¡ï¼ooxml.mdã®ãDocumentã©ã¤ãã©ãªãã»ã¯ã·ã§ã³ãåç§ï¼
æçµããã¥ã¡ã³ããããã¯: python ooxml/scripts/pack.py <input_directory> <office_file>

ããã¥ã¡ã³ãã¬ãã¥ã¼ç¨ã®ã¬ããã©ã¤ã³ã¯ã¼ã¯ããã¼

ãããæ¦ç¥: é¢é£ããå¤æ´ã3-10ã®å¤æ´ã®ãããã«ã°ã«ã¼ãåãã¾ããããã«ãããããã°ãç®¡çãããããªããªããå¹çãç¶æã§ãã¾ããæ¬¡ã®ãããã«é²ãåã«åãããããã¹ããã¦ãã ããã

ä¾ – æä¸ã®ã30 daysããã60 daysãã«å¤æ´:

# æªãä¾ - æå¨ä½ãç½®æ
'<w:del><w:r><w:delText>The term is 30 days.</w:delText></w:r></w:del><w:ins><w:r><w:t>The term is 60 days.</w:t></w:r></w:ins>'

# è¯ãä¾ - å¤æ´é¨åã®ã¿ããã¼ã¯ããå¤æ´ãªãããã¹ãã®åã®<w:r>ãä¿æ
'<w:r w:rsidR="00AB12CD"><w:t>The term is </w:t></w:r><w:del><w:r><w:delText>30</w:delText></w:r></w:del><w:ins><w:r><w:t>60</w:t></w:r></w:ins><w:r w:rsidR="00AB12CD"><w:t> days.</w:t></w:r>'

å¤æ´å±¥æ´ã¯ã¼ã¯ããã¼

markdownè¡¨ç¾ãåå¾: å¤æ´å±¥æ´ãä¿æãã¦ããã¥ã¡ã³ããmarkdownã«å¤æ:
```
pandoc --track-changes=all path-to-file.docx -o current.md
```
å¤æ´ãç¹å®ãã¦ã°ã«ã¼ãå: ããã¥ã¡ã³ããã¬ãã¥ã¼ãã¦å¿è¦ãªãã¹ã¦ã®å¤æ´ãç¹å®ããè«ççãªãããã«æ´ç:

å ´æç¹å®æ¹æ³ï¼XMLã§å¤æ´ãè¦ã¤ããããï¼:
- ã»ã¯ã·ã§ã³/è¦åºãçªå·ï¼ä¾: ãSection 3.2ãããArticle IVãï¼
- çªå·ä»ãã®å ´åã¯æ®µè½èå¥å
- ã¦ãã¼ã¯ãªå¨å²ããã¹ããä½¿ç¨ããgrepãã¿ã¼ã³
- ããã¥ã¡ã³ãæ§é ï¼ä¾: ãfirst paragraphãããsignature blockãï¼
- markdownã®è¡çªå·ã¯ä½¿ç¨ããªã – XMLæ§é ã«ãããã³ã°ãããªã
ãããæ´çï¼ãããããã3-10ã®é¢é£ããå¤æ´ãã°ã«ã¼ãåï¼:
- ã»ã¯ã·ã§ã³å¥: ãBatch 1: Section 2 amendmentsãããBatch 2: Section 5 updatesã
- ã¿ã¤ãå¥: ãBatch 1: Date correctionsãããBatch 2: Party name changesã
- è¤éãå¥: åç´ãªããã¹ãç½®æããå§ããè¤éãªæ§é å¤æ´ã«åãçµã
- é åºå¥: ãBatch 1: Pages 1-3ãããBatch 2: Pages 4-6ã
ããã¥ã¡ã³ããèªãã§å±é:
- å¿é – ãã¡ã¤ã«å¨ä½ãèªã: ooxml.mdï¼ç´600è¡ï¼ãæåããæå¾ã¾ã§å®å¨ã«èªãã§ãã ããããã®ãã¡ã¤ã«ãèªãéã«ç¯å²å¶éãè¨å®ããªãã§ãã ããã ç¹ã«ãDocumentã©ã¤ãã©ãªãã¨ãå¤æ´å±¥æ´ãã¿ã¼ã³ãã»ã¯ã·ã§ã³ã«æ³¨æãã¦ãã ããã
- ããã¥ã¡ã³ããå±é: python ooxml/scripts/unpack.py <file.docx> <dir>
- æ¨å¥¨RSIDã«æ³¨æ: unpackã¹ã¯ãªããã¯å¤æ´å±¥æ´ã«ä½¿ç¨ããRSIDãææ¡ãã¾ããã¹ããã4bã§ä½¿ç¨ããããã«ãã®RSIDãã³ãã¼ãã¦ãã ããã
ãããã§å¤æ´ãå®è£: å¤æ´ãè«ççã«ã°ã«ã¼ãåï¼ã»ã¯ã·ã§ã³å¥ãã¿ã¤ãå¥ãã¾ãã¯è¿æ¥æ§å¥ï¼ããåä¸ã®ã¹ã¯ãªããã§ã¾ã¨ãã¦å®è£ãã¾ãããã®ã¢ããã¼ã:
- ãããã°ãå®¹æã«ããï¼å°ããããã = ã¨ã©ã¼ã®åé¢ãå®¹æï¼
- æ®µéçãªé²æãå¯è½ã«ãã
- å¹çãç¶æï¼3-10å¤æ´ã®ããããµã¤ãºãé©åï¼
æ¨å¥¨ãããã°ã«ã¼ãå:
- ããã¥ã¡ã³ãã»ã¯ã·ã§ã³å¥ï¼ä¾: ãSection 3 changesãããDefinitionsãããTermination clauseãï¼
- å¤æ´ã¿ã¤ãå¥ï¼ä¾: ãDate changesãããParty name updatesãããLegal term replacementsãï¼
- è¿æ¥æ§å¥ï¼ä¾: ãChanges on pages 1-3ãããChanges in first half of documentãï¼
é¢é£ããå¤æ´ã®åãããã«ã¤ãã¦:

a. ããã¹ããXMLã«ãããã³ã°: word/document.xmlã§ããã¹ããgrepãã¦ãããã¹ãã<w:r>è¦ç´ éã§ã©ã®ããã«åå²ããã¦ããããç¢ºèªã

b. ã¹ã¯ãªãããä½æãã¦å®è¡: get_nodeãä½¿ç¨ãã¦ãã¼ããè¦ã¤ããå¤æ´ãå®è£ããdoc.save()ãå®è¡ããã¿ã¼ã³ã«ã¤ãã¦ã¯ooxml.mdã®**ãDocumentã©ã¤ãã©ãªã**ã»ã¯ã·ã§ã³ãåç§ã

æ³¨æ: ã¹ã¯ãªãããæ¸ãç´åã«å¸¸ã«word/document.xmlãgrepãã¦ãç¾å¨ã®è¡çªå·ãåå¾ãããã¹ãåå®¹ãç¢ºèªãã¦ãã ãããè¡çªå·ã¯åã¹ã¯ãªããå®è¡å¾ã«å¤ããã¾ãã
ããã¥ã¡ã³ããããã¯: ãã¹ã¦ã®ããããå®äºããããå±éããããã£ã¬ã¯ããªã.docxã«æ»ã:
```
python ooxml/scripts/pack.py unpacked reviewed-document.docx
```
æçµæ¤è¨¼: å®å¨ãªããã¥ã¡ã³ãã®åæ¬çãªãã§ãã¯ãè¡ã:
- æçµããã¥ã¡ã³ããmarkdownã«å¤æ:
```
pandoc --track-changes=all reviewed-document.docx -o verification.md
```
- ãã¹ã¦ã®å¤æ´ãæ£ããé©ç¨ããããã¨ãç¢ºèª:
```
grep "original phrase" verification.md  # è¦ã¤ãããªãã¯ã
grep "replacement phrase" verification.md  # è¦ã¤ããã¯ã
```
- æå³ããªãå¤æ´ãå°å¥ããã¦ããªããã¨ãç¢ºèª

ããã¥ã¡ã³ããç»åã«å¤æ

DOCXãPDFã«å¤æ:

soffice --headless --convert-to pdf document.docx

PDFãã¼ã¸ãJPEGç»åã«å¤æ:
```
pdftoppm -jpeg -r 150 document.pdf page
```
ããã«ããpage-1.jpgãpage-2.jpgãªã©ã®ãã¡ã¤ã«ãä½æããã¾ãã

ãªãã·ã§ã³:

-jpeg: JPEGå½¢å¼ã§åºåï¼PNGãå¥½ãå ´åã¯-pngãä½¿ç¨ï¼
-f N: å¤æéå§ãã¼ã¸ï¼ä¾: -f 2ã§ãã¼ã¸2ããéå§ï¼
-l N: å¤æçµäºãã¼ã¸ï¼ä¾: -l 5ã§ãã¼ã¸5ã§åæ¢ï¼
page: åºåãã¡ã¤ã«ã®ãã¬ãã£ãã¯ã¹

ç¹å®ç¯å²ã®ä¾:

pdftoppm -jpeg -r 150 -f 2 -l 5 document.pdf page  # ãã¼ã¸2-5ã®ã¿å¤æ

éè¦: DOCXæä½ç¨ã®ã³ã¼ããçæããé:

ç°¡æ½ãªã³ã¼ããæ¸ã
åé·ãªå¤æ°åãéè¤ããæä½ãé¿ãã
ä¸è¦ãªprintæãé¿ãã

ä¾åé¢ä¿

pandoc: sudo apt-get install pandocï¼ããã¹ãæ½åºç¨ï¼
docx: npm install -g docxï¼æ°è¦ããã¥ã¡ã³ãä½æç¨ï¼
LibreOffice: sudo apt-get install libreofficeï¼PDFå¤æç¨ï¼
Poppler: sudo apt-get install poppler-utilsï¼pdftoppmã§PDFãç»åã«å¤æï¼
defusedxml: pip install defusedxmlï¼å®å¨ãªXMLè§£æç¨ï¼

GitHub 仓库 ↗ ← 返回陌讯 Skills 聚合平台

docx

Agent 安装分布

Skill 文档

DOCXã®ä½æãç·¨éãåæ

æ¦è¦

ã¯ã¼ã¯ãã­ã¼æ±ºå®ããªã¼

ã³ã³ãã³ãã®èª­ã¿åã/åæ

æ°è¦ãã­ã¥ã¡ã³ãã®ä½æ

æ¢å­ãã­ã¥ã¡ã³ãã®ç·¨é

ã³ã³ãã³ãã®èª­ã¿åãã¨åæ

ãã­ã¹ãæ½åº

Raw XMLã¢ã¯ã»ã¹

ãã¡ã¤ã«ã®å±é

ä¸»è¦ãªãã¡ã¤ã«æ§é

æ°è¦Wordãã­ã¥ã¡ã³ãã®ä½æ

ã¯ã¼ã¯ãã­ã¼

æ¢å­Wordãã­ã¥ã¡ã³ãã®ç·¨é

ã¯ã¼ã¯ãã­ã¼

ãã­ã¥ã¡ã³ãã¬ãã¥ã¼ç¨ã®ã¬ããã©ã¤ã³ã¯ã¼ã¯ãã­ã¼

å¤æ´å±¥æ­´ã¯ã¼ã¯ãã­ã¼

ãã­ã¥ã¡ã³ããç»åã«å¤æ

ã³ã¼ãã¹ã¿ã¤ã«ã¬ã¤ãã©ã¤ã³

ä¾å­é¢ä¿

DOCXã®ä½æãç·¨éãåæ

æ¦è¦

ã¯ã¼ã¯ããã¼æ±ºå®ããªã¼

ã³ã³ãã³ãã®èªã¿åã/åæ

æ°è¦ããã¥ã¡ã³ãã®ä½æ

æ¢åããã¥ã¡ã³ãã®ç·¨é

ã³ã³ãã³ãã®èªã¿åãã¨åæ

ããã¹ãæ½åº

Raw XMLã¢ã¯ã»ã¹

ãã¡ã¤ã«ã®å±é

ä¸»è¦ãªãã¡ã¤ã«æ§é

æ°è¦Wordããã¥ã¡ã³ãã®ä½æ

ã¯ã¼ã¯ããã¼

æ¢åWordããã¥ã¡ã³ãã®ç·¨é

ã¯ã¼ã¯ããã¼

ããã¥ã¡ã³ãã¬ãã¥ã¼ç¨ã®ã¬ããã©ã¤ã³ã¯ã¼ã¯ããã¼

å¤æ´å±¥æ´ã¯ã¼ã¯ããã¼

ããã¥ã¡ã³ããç»åã«å¤æ

ã³ã¼ãã¹ã¿ã¤ã«ã¬ã¤ãã©ã¤ã³

ä¾åé¢ä¿