update-study

📁 iamseungpil/claude-for-dslab 📅 9 days ago

总安装量

周安装量

#49092

全站排名

安装命令

npx skills add https://github.com/iamseungpil/claude-for-dslab --skill update-study

Agent 安装分布

claude-code 1

Skill 文档

Update Study – Enhanced Iterative Experiment Analysis

Core Features

Incremental Detection – ì ì¤íë§ ë¶ì (ì´ë¯¸ ë¬¸ìíë ì¤í ì¤íµ)
Iterative Writing Loop – ê¸ íì§ ê°ì ë£¨í (clarity, coherence, insight depth)
Zero Hallucination – ë¡ê·¸ ë ë²¨ êµì°¨ ê²ì¦
PDF Export – ìµì¢ ë¬¸ìë¥¼ PDFë¡ ë³í

Usage

/update-study <log_path(s)> <study_md_path>

log_path(s): ì¤í ë¡ê·¸ íì¼ ê²½ë¡ (ê³µë°±ì¼ë¡ êµ¬ë¶íì¬ ì¬ë¬ ê° ê°ë¥)
study_md_path: ìë°ì´í¸í study markdown íì¼ ê²½ë¡

Arguments Parsing

$ARGUMENTSìì ë§ì§ë§ ì¸ìê° .md íì¼ì´ë©´ study íì¼, ëë¨¸ì§ë ë¡ê·¸ íì¼ë¡ íì±í©ëë¤.

ìì:
  /update-study logs/exp1.log results/study.md
  â log_files: ["logs/exp1.log"]
  â study_file: "results/study.md"

  /update-study logs/exp1.log logs/exp2.log memgen_ablation_study.md
  â log_files: ["logs/exp1.log", "logs/exp2.log"]
  â study_file: "memgen_ablation_study.md"

Workflow Overview

Phase 0: Incremental Detection (NEW)
  âââ logs/ ì¤ìº
  âââ ê¸°ì¡´ study íì± (ì´ë¯¸ ë¶ìë ì¤í ìë³)
  âââ ì ì¤í ëª©ë¡ ìì± â ìì¼ë©´ "No new experiments" ì¶ë ¥ í ì¢ë£

Phase 1: File Verification
  âââ ë¡ê·¸ íì¼ ì¡´ì¬ íì¸
  âââ study.md ì½ê¸°

Phase 2: Interpretation
  âââ experiment-interpreter í¸ì¶
  âââ ë©í¸ë¦ ì¶ì¶ + ì´ì ìì±

Phase 2b: Writing Quality Loop (NEW)
  âââ Quality evaluation (clarity, coherence, insight)
  âââ Revision if needed (definition-first, topic-first)
  âââ Max 3 iterations, pass at score â¥ 80

Phase 3: Append to Document
  âââ [NEW] íê·¸ë¡ ì ì¹ì íì
  âââ Timeline íì´ë¸ ìë°ì´í¸

Phase 4: Verification
  âââ experiment-verifier í¸ì¶
  âââ ì«ì ì íì± ê²ì¦
  âââ ë¼ë¦¬ ì¼ê´ì± ê²ì¦

Phase 5: Export (NEW)
  âââ PDF ë³í (pandoc/weasyprint)
  âââ ìë£ ë³´ê³

Phase 0: Incremental Detection (NEW)

Step 0.1: ë¡ê·¸ ëë í ë¦¬ ì¤ìº

1. logs/ ëë í ë¦¬ìì ëª¨ë  ë¡ê·¸ íì¼ ëª©ë¡ ìì±
   - í¨í´: *_train.log, *_eval.log, *.log
   - íì¼ ìì  ìê° ê¸°ì¤ ì ë ¬

2. ìë ¥ë ë¡ê·¸ íì¼ ëª©ë¡ê³¼ êµì°¨ íì¸

Step 0.2: ê¸°ì¡´ Study ë¶ì

ê¸°ì¡´ study.mdìì ì´ë¯¸ ë¬¸ìíë ì¤í ìë³:

1. ì¤í í¤ë í¨í´ ê²ì:
   - `### E{N}:` ëë `### Experiment:`
   - `## Experiment {N}:`

2. ë¡ê·¸ íì¼ ì°¸ì¡° ì¶ì¶:
   - `[*_train.log:*]` íìì ì¶ì² íê¸°
   - `Source:` ì´ì íì¼ëª

3. ë¬¸ìíë ì¤í ëª©ë¡ êµ¬ì¶:
   documented_experiments = {
       "evolve_h_only_train.log",
       "cross_attn_train.log",
       ...
   }

Step 0.3: ì ì¤í ê²°ì

new_experiments = set(input_logs) - set(documented_experiments)

if len(new_experiments) == 0:
    print("â No new experiments to analyze")
    print(f"  Already documented: {len(documented_experiments)} experiments")
    exit()  # ì¢ë£
else:
    print(f"ð Found {len(new_experiments)} new experiment(s) to analyze:")
    for exp in new_experiments:
        print(f"  - {exp}")

Phase 1: File Verification

Step 1.1: íì¼ íì¸

1. ì ì¤í ë¡ê·¸ íì¼ ì¡´ì¬ íì¸
   - ê° log_pathì ëí´ íì¼ ì¡´ì¬ ì¬ë¶ íì¸
   - ì¡´ì¬íì§ ìì¼ë©´ ìë¬ ë©ìì§ ì¶ë ¥ í ì¤ë¨

2. study.md íì¼ íì¸
   - íì¼ì´ ì¡´ì¬íë©´ Read toolë¡ ì ì²´ ë´ì© ì½ê¸°
   - íì¼ì´ ìì¼ë©´ ìë¡ ìì±í  ê²ìì ìë´

3. ë¡ê·¸ íì¼ ìì½ ì ë³´ ì¶ì¶ (ë¹ ë¥¸ ì¤ìº)
   - ì¤í config íì¼ ê²½ë¡
   - ì¤í ëª¨ë (train/evaluate)
   - ìµì¢ metric ë¼ì¸ ìì¹

Step 1.2: ê¸°ì¡´ study.md ë¶ì

ê¸°ì¡´ study.mdìì íì¸í  ì¬í:
- ì´ë¯¸ ê¸°ë¡ë ì¤í ëª©ë¡
- ë¹êµ ê°ë¥í baseline ê²°ê³¼
- ë¯¸í´ê²° ê°ì¤ ëª©ë¡
- ê³íë ì¤í ëª©ë¡ (ì´ë² ì¤íì´ ê¸°ì¡´ ê³íì í´ë¹íëì§)

Phase 2: Interpretation (experiment-interpreter)

Task Tool í¸ì¶

Task tool ì¬ì©:
- subagent_type: "experiment-interpreter"
- prompt:

  "ë¤ì ì¤í ë¡ê·¸ë¥¼ ë¶ìíê³  study.md ìë°ì´í¸ ì´ìì ìì±í´ì£¼ì¸ì.

  ## ë¡ê·¸ íì¼
  {ê° ë¡ê·¸ íì¼ì ì ì²´ ê²½ë¡}

  ## ê¸°ì¡´ study.md ë´ì© (ë¹êµì©)
  {ê¸°ì¡´ study.mdì ê²°ê³¼ ìì½ íì´ë¸}

  ## ì´ì  ê²ì¦ í¼ëë°± (ìë ê²½ì°)
  {verifierì feedback_summary - ì²« iterationìë ìì}

  ## ìêµ¬ì¬í
  1. ë¡ê·¸ìì ëª¨ë  ìì¹ë¥¼ ì¶ì¶íê³  (source: filepath:Líë²í¸) íìì¼ë¡ ì¶ì² íê¸°
  2. ê¸°ì¡´ ê²°ê³¼ì ë¹êµ íì´ë¸ ìì±
  3. ë°ì´í°ì ê¸°ë°í í´ì ìì±
  4. ê° ê°ì¤ì falsifiable + prediction + falsification í¬í¨
  5. ë¤ì ì¤íì êµ¬ì²´ì  config ë³ê²½ í¬í¨
  6. ì¶ë ¥ì study.mdì ë°ë¡ appendí  ì ìë markdown íì

  ## ì¶ë ¥ íì
  references/interpretation-template.md ííë¦¿ì ë°ë¼ì£¼ì¸ì."

Phase 2b: Writing Quality Loop (NEW)

Step 2b.1: Quality Evaluation

ìì±ë ì´ìì ëí´ íì§ íê° ìí:

íê° ê¸°ì¤ (references/quality-criteria.md ì°¸ì¡°):

1. Definition-First (30ì )
   - ëª¨ë  ì ë¬¸ ì©ì´ê° "X is Y" ííë¡ ì ìëìëê°?
   - ìë¡ì´ ê°ëì´ ì¬ì© ì ì ì ìëìëê°?

2. Topic-First Paragraphs (25ì )
   - ëª¨ë  ë¬¸ë¨ì´ íµì¬ ê²°ê³¼/ì£¼ì¥ì¼ë¡ ììíëê°?
   - ì²« ë¬¸ì¥ë§ ì½ì´ë ë¬¸ë¨ ë´ì©ì íìí  ì ìëê°?

3. Compare-Contrast (20ì )
   - ì ê²°ê³¼ê° ì´ì  ì¤íê³¼ ë¹êµëìëê°?
   - ì°¨ì´ì ìì¸/í´ìì´ ì ìëìëê°?

4. Insight Depth (15ì )
   - íë©´ì  ê¸°ì ì ëì´ "ì"ì ëí ë¶ìì´ ìëê°?
   - ììê³¼ ë¤ë¥¸ ê²°ê³¼ì ëí ê°ì¤ì´ ìëê°?

5. Minimal Adjectives (10ì )
   - ë¶íìí ììì´ê° ìëê°?
   - ì£¼ê´ì  íí ëì  êµ¬ì²´ì  ìì¹ê° ì¬ì©ëìëê°?

ì´ì : /100
íµê³¼ ê¸°ì¤: â¥ 80ì

Step 2b.2: Revision

ì ìê° 80ì ë¯¸ë§ì¸ ê²½ì° ìì :

1. [Critical: Definition Missing]
   - ë¯¸ì ì ì©ì´ ëª©ë¡ ìì±
   - ê° ì©ì´ì ëí´ "X is Y" ì ì ì¶ê°

2. [Critical: Topic-Last Paragraph]
   - ë¬¸ë¨ ì¬êµ¬ì±: íµì¬ â ì¤ëª â ê·¼ê±° ììë¡

3. [Warning: No Comparison]
   - ì´ì  ì¤íê³¼ì ë¹êµ íì´ë¸ ì¶ê°
   - ì°¨ì´ ë¶ì ë¬¸ë¨ ì¶ê°

4. [Warning: Shallow Insight]
   - "ì ì´ë° ê²°ê³¼ê° ëìëê°?" ë¶ì ì¶ê°
   - ê°ì¤ ê°í

5. [Minor: Excessive Adjectives]
   - "significantly improved" â "+12.5%p"
   - "much faster" â "2.3x speedup"

Step 2b.3: Iteration Control

ìµë ë°ë³µ: 3í

Iteration 1: ì´ì â íì§ íê° â ìì  (íìì)
  â Score â¥ 80: Phase 3ì¼ë¡ ì§í
  â Score < 80: feedback ìì§

Iteration 2: ìì ì â ì¬íê°
  â Score â¥ 80: Phase 3ì¼ë¡ ì§í
  â Score < 80: feedback ìì§

Iteration 3: ìµì¢ ìì  â ì¬íê°
  â Score â¥ 80: Phase 3ì¼ë¡ ì§í
  â Score < 80: íì¬ ìµì  ë²ì ì¼ë¡ ì§í + ì´ì ë³´ê³

Phase 3: Document Update

ì¶ê° ê·ì¹

Append Only: ê¸°ì¡´ ë´ì© ë¤ì ì ì¹ì ì¶ê°. ê¸°ì¡´ ë´ì© ìì ê¸ì§.
[NEW] íê·¸: ìë¡ ì¶ê°ë ì¤íì [NEW] íê·¸ íì (ë¤ì ìë°ì´í¸ ì ì ê±°)
êµ¬ë¶ì : ì ì¤í ì ì --- êµ¬ë¶ì ì½ì
ë ì§ íê¸°: ì¤í ì¤í ë ì§ (ë¡ê·¸ íìì¤í¬í ê¸°ë°)
ì¼ê´ë í¬ë§·: references/interpretation-template.md ííë¦¿ ì¤ì

[NEW] íê·¸ ì²ë¦¬

---

### [NEW] Experiment: {experiment_name} ({YYYY-MM-DD})

...

ë¤ì /update-study ì¤í ì:

ì´ì ì ì¶ê°ë [NEW] íê·¸ ëª¨ë ì ê±°
ìë¡ ì¶ê°ëë ì¹ììë§ [NEW] íê·¸ ë¶ì¬

Phase 4: Verification (experiment-verifier)

Task Tool í¸ì¶

Task tool ì¬ì©:
- subagent_type: "experiment-verifier"
- prompt:

  "ë¤ì study.md ìë°ì´í¸ ë´ì©ì ê²ì¦í´ì£¼ì¸ì.

  ## ê²ì¦ ëì (ìë¡ ì¶ê°ë ì¹ì)
  {Phase 3ìì ì¶ê°í ë´ì©}

  ## ìë³¸ ë¡ê·¸ íì¼ ê²½ë¡
  {ê° ë¡ê·¸ íì¼ì ì ì²´ ê²½ë¡}

  ## ê¸°ì¡´ study.md (ë³ê²½ ì¬ë¶ íì¸ì©)
  {ê¸°ì¡´ study.md ë´ì©}

  ## ê²ì¦ ìêµ¬ì¬í
  1. ëª¨ë  ìì¹ë¥¼ ìë³¸ ë¡ê·¸ì ëì¡° (íì¼:ë¼ì¸ ì§ì  íì¸)
  2. í´ìì ë¼ë¦¬ì  íë¹ì± ê²ì¦
  3. ëª¨ë  ê°ì¤ì falsifiability íì¸
  4. ë¤ì ì¤íì ì¤í ê°ë¥ì± íì¸
  5. ê¸°ì¡´ ê²°ê³¼ ë³ê²½ ì¬ë¶ íì¸

  ## ì¶ë ¥
  JSON íìì ê²ì¦ ë³´ê³ ìë¥¼ ë°íí´ì£¼ì¸ì."

ê²°ê³¼ ì²ë¦¬

if verdict == "PASS":
    # Phase 5ë¡ ì§í
elif iteration < 3:
    # feedback_summaryë¥¼ Phase 2ë¡ ì ë¬
    # interpreterìê² ìì  ìì²
else:
    # ìµë ë°ë³µ ëë¬
    # íì¬ ìµì  ë²ì  ì ì¥
    # ë¯¸í´ê²° ì´ì ì¬ì©ììê² ë³´ê³

Phase 5: Export (NEW)

Step 5.1: Markdown íì

1. study.md ìµì¢ ë´ì© ì ì¥
2. [NEW] íê·¸ê° í¬í¨ë ì¹ì íì¸

Step 5.2: PDF ë³í

scripts/export_pdf.py ì¬ì©:

python scripts/export_pdf.py study.md study.pdf

ë³í ìµì:
- TOC (Table of Contents) í¬í¨
- [NEW] íê·¸ ìê°ì  ê°ì¡° (ë¸ëì íì´ë¼ì´í¸)
- íì´ë¸ ê¹ëí í¬ë§·í
- ì½ë ë¸ë¡ ë¬¸ë² ê°ì¡°

Fallback ìì:
1. pandoc + LaTeX (ìµìì íì§)
2. weasyprint (pandoc ìì ì)
3. Markdownë§ ì ì¥ (PDF ë³í ì¤í¨ ì ê²½ê³ )

Step 5.3: ìë£ ë³´ê³

â Update Complete!
  ð Markdown: study.md
  ð PDF: study.pdf (optional)
  ð New experiments: {N}ê°
  ð¬ Hypotheses: {N}ê°
  ð§ª Next experiments: {N}ê°

Progress Reporting

[Phase 0] Incremental Detection...
  â Scanned logs/: {N}ê° íì¼
  â Already documented: {M}ê° ì¤í
  â New experiments: {K}ê° ë°ê²¬

[Phase 1] File Verification...
  â ë¡ê·¸ íì¼ íì¸: {K}ê°
  â study.md ì½ê¸° ìë£

[Phase 2] Interpretation...
  â ìì¹ ì¶ì¶: {N}ê° ë©í¸ë¦
  â ë¹êµ íì´ë¸ ìì±

[Phase 2b] Writing Quality Loop...
  â Iteration 1: Score 72/100
    - Critical: Definition missing (2)
    - Warning: Topic-last paragraph (1)
  â Iteration 2: Score 85/100
    â All critical issues resolved

[Phase 3] Document Update...
  â ì ì¹ì ì¶ê° ([NEW] íê·¸)

[Phase 4] Verification...
  â Numerical: {verified}/{total}
  â Logic: {sound}/{total}
  â Verdict: PASS

[Phase 5] Export...
  â PDF ë³í ìë£

â Complete!
  - New experiments: {experiment_names}
  - Accuracy: {X.XX%}
  - Hypotheses: {N}ê°
  - Next experiments: {N}ê°

Quality Criteria Summary

Criterion	Weight	Pass Threshold
Definition-First	30ì	ì©ì´ 100% ì ì
Topic-First	25ì	ë¬¸ë¨ 90% ëê´ì
Compare-Contrast	20ì	ë¹êµ íì´ë¸ íì
Insight Depth	15ì	“ì” ë¶ì í¬í¨
Minimal Adjectives	10ì	ìì¹ ê¸°ë° íí

Overall Pass: â¥ 80ì 

Additional Resources

references/interpretation-template.md – ì¤í í´ì ííë¦¿
references/quality-criteria.md – ê¸ íì§ íê° ìì¸ ê¸°ì¤
scripts/export_pdf.py – PDF ë³í ì í¸ë¦¬í°

Cautions

Append Only: ì´ì ê²°ê³¼ë¥¼ ì ë ìì íì§ ìì
ë§¤ ìì¹ì ì¶ì²: (source: filepath:Líë²í¸) íì
ê°ì¤ì falsifiable: ê²ì¦ ë¶ê°ë¥í ê°ì¤ì ìì
ì ì¤í ì°ì : ì´ë¯¸ ë¬¸ìíë ì¤íì ìë ì¤íµ
[NEW] íê·¸: ì ì¶ê°ë¶ ëªíí íì

GitHub 仓库 ↗ ← 返回陌讯 Skills 聚合平台

update-study

Agent 安装分布

Skill 文档

Update Study – Enhanced Iterative Experiment Analysis

Core Features

Usage

Arguments Parsing

Workflow Overview

Phase 0: Incremental Detection (NEW)

Step 0.1: ë¡ê·¸ ëë í ë¦¬ ì¤ìº

Step 0.2: ê¸°ì¡´ Study ë¶ì

Step 0.3: ì ì¤í ê²°ì 

Phase 1: File Verification

Step 1.1: íì¼ íì¸

Step 1.2: ê¸°ì¡´ study.md ë¶ì

Phase 2: Interpretation (experiment-interpreter)

Task Tool í¸ì¶

Phase 2b: Writing Quality Loop (NEW)

Step 2b.1: Quality Evaluation

Step 2b.2: Revision

Step 2b.3: Iteration Control

Phase 3: Document Update

ì¶ê° ê·ì¹

[NEW] íê·¸ ì²ë¦¬

Phase 4: Verification (experiment-verifier)

Task Tool í¸ì¶

ê²°ê³¼ ì²ë¦¬

Phase 5: Export (NEW)

Step 5.1: Markdown íì 

Step 5.2: PDF ë³í

Step 5.3: ìë£ ë³´ê³

Progress Reporting

Quality Criteria Summary

Additional Resources

Cautions

Step 0.1: ë¡ê·¸ ëë í ë¦¬ ì¤ìº

Step 0.2: ê¸°ì¡´ Study ë¶ì

Step 0.3: ì ì¤í ê²°ì

Step 1.1: íì¼ íì¸

Step 1.2: ê¸°ì¡´ study.md ë¶ì

Task Tool í¸ì¶

ì¶ê° ê·ì¹

[NEW] íê·¸ ì²ë¦¬

Task Tool í¸ì¶

ê²°ê³¼ ì²ë¦¬

Step 5.1: Markdown íì

Step 5.2: PDF ë³í

Step 5.3: ìë£ ë³´ê³