update-study
1
总安装量
1
周安装量
#49092
全站排名
安装命令
npx skills add https://github.com/iamseungpil/claude-for-dslab --skill update-study
Agent 安装分布
claude-code
1
Skill 文档
Update Study – Enhanced Iterative Experiment Analysis
ì¤í ë¡ê·¸ë¥¼ ë¶ìíì¬ study 문ì를 ì ë°ì´í¸íë ì¤í¬ì ëë¤.
Core Features
- Incremental Detection – ì ì¤íë§ ë¶ì (ì´ë¯¸ 문ìíë ì¤í ì¤íµ)
- Iterative Writing Loop – ê¸ íì§ ê°ì 루í (clarity, coherence, insight depth)
- Zero Hallucination – ë¡ê·¸ ë 벨 êµì°¨ ê²ì¦
- PDF Export – ìµì¢ 문ì를 PDFë¡ ë³í
Usage
/update-study <log_path(s)> <study_md_path>
log_path(s): ì¤í ë¡ê·¸ íì¼ ê²½ë¡ (공백ì¼ë¡ 구ë¶íì¬ ì¬ë¬ ê° ê°ë¥)study_md_path: ì ë°ì´í¸í study markdown íì¼ ê²½ë¡
Arguments Parsing
$ARGUMENTSìì ë§ì§ë§ ì¸ìê° .md íì¼ì´ë©´ study íì¼, ë머ì§ë ë¡ê·¸ íì¼ë¡ íì±í©ëë¤.
ìì:
/update-study logs/exp1.log results/study.md
â log_files: ["logs/exp1.log"]
â study_file: "results/study.md"
/update-study logs/exp1.log logs/exp2.log memgen_ablation_study.md
â log_files: ["logs/exp1.log", "logs/exp2.log"]
â study_file: "memgen_ablation_study.md"
Workflow Overview
Phase 0: Incremental Detection (NEW)
âââ logs/ ì¤ìº
âââ 기존 study íì± (ì´ë¯¸ ë¶ìë ì¤í ìë³)
âââ ì ì¤í ëª©ë¡ ìì± â ìì¼ë©´ "No new experiments" ì¶ë ¥ í ì¢
ë£
Phase 1: File Verification
âââ ë¡ê·¸ íì¼ ì¡´ì¬ íì¸
âââ study.md ì½ê¸°
Phase 2: Interpretation
âââ experiment-interpreter í¸ì¶
âââ ë©í¸ë¦ ì¶ì¶ + ì´ì ìì±
Phase 2b: Writing Quality Loop (NEW)
âââ Quality evaluation (clarity, coherence, insight)
âââ Revision if needed (definition-first, topic-first)
âââ Max 3 iterations, pass at score ⥠80
Phase 3: Append to Document
âââ [NEW] íê·¸ë¡ ì ì¹ì
íì
âââ Timeline í
ì´ë¸ ì
ë°ì´í¸
Phase 4: Verification
âââ experiment-verifier í¸ì¶
âââ ì«ì ì íì± ê²ì¦
âââ ë
¼ë¦¬ ì¼ê´ì± ê²ì¦
Phase 5: Export (NEW)
âââ PDF ë³í (pandoc/weasyprint)
âââ ìë£ ë³´ê³
Phase 0: Incremental Detection (NEW)
Step 0.1: ë¡ê·¸ ëë í 리 ì¤ìº
1. logs/ ëë í 리ìì 모ë ë¡ê·¸ íì¼ ëª©ë¡ ìì±
- í¨í´: *_train.log, *_eval.log, *.log
- íì¼ ìì ìê° ê¸°ì¤ ì ë ¬
2. ì
ë ¥ë ë¡ê·¸ íì¼ ëª©ë¡ê³¼ êµì°¨ íì¸
Step 0.2: 기존 Study ë¶ì
기존 study.mdìì ì´ë¯¸ 문ìíë ì¤í ìë³:
1. ì¤í í¤ë í¨í´ ê²ì:
- `### E{N}:` ëë `### Experiment:`
- `## Experiment {N}:`
2. ë¡ê·¸ íì¼ ì°¸ì¡° ì¶ì¶:
- `[*_train.log:*]` íìì ì¶ì² í기
- `Source:` ì´ì íì¼ëª
3. 문ìíë ì¤í ëª©ë¡ êµ¬ì¶:
documented_experiments = {
"evolve_h_only_train.log",
"cross_attn_train.log",
...
}
Step 0.3: ì ì¤í ê²°ì
new_experiments = set(input_logs) - set(documented_experiments)
if len(new_experiments) == 0:
print("â No new experiments to analyze")
print(f" Already documented: {len(documented_experiments)} experiments")
exit() # ì¢
ë£
else:
print(f"ð Found {len(new_experiments)} new experiment(s) to analyze:")
for exp in new_experiments:
print(f" - {exp}")
Phase 1: File Verification
Step 1.1: íì¼ íì¸
1. ì ì¤í ë¡ê·¸ íì¼ ì¡´ì¬ íì¸
- ê° log_pathì ëí´ íì¼ ì¡´ì¬ ì¬ë¶ íì¸
- ì¡´ì¬íì§ ìì¼ë©´ ìë¬ ë©ìì§ ì¶ë ¥ í ì¤ë¨
2. study.md íì¼ íì¸
- íì¼ì´ ì¡´ì¬íë©´ Read toolë¡ ì ì²´ ë´ì© ì½ê¸°
- íì¼ì´ ìì¼ë©´ ìë¡ ìì±í ê²ìì ìë´
3. ë¡ê·¸ íì¼ ìì½ ì ë³´ ì¶ì¶ (ë¹ ë¥¸ ì¤ìº)
- ì¤í config íì¼ ê²½ë¡
- ì¤í 모ë (train/evaluate)
- ìµì¢
metric ë¼ì¸ ìì¹
Step 1.2: 기존 study.md ë¶ì
기존 study.mdìì íì¸í ì¬í:
- ì´ë¯¸ 기ë¡ë ì¤í 목ë¡
- ë¹êµ ê°ë¥í baseline ê²°ê³¼
- 미í´ê²° ê°ì¤ 목ë¡
- ê³íë ì¤í ëª©ë¡ (ì´ë² ì¤íì´ ê¸°ì¡´ ê³íì í´ë¹íëì§)
Phase 2: Interpretation (experiment-interpreter)
Task Tool í¸ì¶
Task tool ì¬ì©:
- subagent_type: "experiment-interpreter"
- prompt:
"ë¤ì ì¤í ë¡ê·¸ë¥¼ ë¶ìíê³ study.md ì
ë°ì´í¸ ì´ìì ìì±í´ì£¼ì¸ì.
## ë¡ê·¸ íì¼
{ê° ë¡ê·¸ íì¼ì ì ì²´ ê²½ë¡}
## 기존 study.md ë´ì© (ë¹êµì©)
{기존 study.mdì ê²°ê³¼ ìì½ í
ì´ë¸}
## ì´ì ê²ì¦ í¼ëë°± (ìë ê²½ì°)
{verifierì feedback_summary - 첫 iterationìë ìì}
## ì구ì¬í
1. ë¡ê·¸ìì 모ë ìì¹ë¥¼ ì¶ì¶íê³ (source: filepath:Líë²í¸) íìì¼ë¡ ì¶ì² í기
2. 기존 ê²°ê³¼ì ë¹êµ í
ì´ë¸ ìì±
3. ë°ì´í°ì 기ë°í í´ì ìì±
4. ê° ê°ì¤ì falsifiable + prediction + falsification í¬í¨
5. ë¤ì ì¤íì 구체ì config ë³ê²½ í¬í¨
6. ì¶ë ¥ì study.mdì ë°ë¡ appendí ì ìë markdown íì
## ì¶ë ¥ íì
references/interpretation-template.md í
í릿ì ë°ë¼ì£¼ì¸ì."
Phase 2b: Writing Quality Loop (NEW)
Step 2b.1: Quality Evaluation
ìì±ë ì´ìì ëí´ íì§ íê° ìí:
íê° ê¸°ì¤ (references/quality-criteria.md 참조):
1. Definition-First (30ì )
- 모ë ì 문 ì©ì´ê° "X is Y" ííë¡ ì ìëìëê°?
- ìë¡ì´ ê°ë
ì´ ì¬ì© ì ì ì ìëìëê°?
2. Topic-First Paragraphs (25ì )
- 모ë 문ë¨ì´ íµì¬ ê²°ê³¼/주ì¥ì¼ë¡ ììíëê°?
- 첫 문ì¥ë§ ì½ì´ë ë¬¸ë¨ ë´ì©ì íì
í ì ìëê°?
3. Compare-Contrast (20ì )
- ì ê²°ê³¼ê° ì´ì ì¤íê³¼ ë¹êµëìëê°?
- ì°¨ì´ì ìì¸/í´ìì´ ì ìëìëê°?
4. Insight Depth (15ì )
- íë©´ì 기ì ì ëì´ "ì"ì ëí ë¶ìì´ ìëê°?
- ììê³¼ ë¤ë¥¸ ê²°ê³¼ì ëí ê°ì¤ì´ ìëê°?
5. Minimal Adjectives (10ì )
- ë¶íìí ììì´ê° ìëê°?
- 주ê´ì íí ëì 구체ì ìì¹ê° ì¬ì©ëìëê°?
ì´ì : /100
íµê³¼ 기ì¤: ⥠80ì
Step 2b.2: Revision
ì ìê° 80ì 미ë§ì¸ ê²½ì° ìì :
1. [Critical: Definition Missing]
- 미ì ì ì©ì´ ëª©ë¡ ìì±
- ê° ì©ì´ì ëí´ "X is Y" ì ì ì¶ê°
2. [Critical: Topic-Last Paragraph]
- ë¬¸ë¨ ì¬êµ¬ì±: íµì¬ â ì¤ëª
â 근거 ììë¡
3. [Warning: No Comparison]
- ì´ì ì¤íê³¼ì ë¹êµ í
ì´ë¸ ì¶ê°
- ì°¨ì´ ë¶ì ë¬¸ë¨ ì¶ê°
4. [Warning: Shallow Insight]
- "ì ì´ë° ê²°ê³¼ê° ëìëê°?" ë¶ì ì¶ê°
- ê°ì¤ ê°í
5. [Minor: Excessive Adjectives]
- "significantly improved" â "+12.5%p"
- "much faster" â "2.3x speedup"
Step 2b.3: Iteration Control
ìµë ë°ë³µ: 3í
Iteration 1: ì´ì â íì§ íê° â ìì (íìì)
â Score ⥠80: Phase 3ì¼ë¡ ì§í
â Score < 80: feedback ìì§
Iteration 2: ìì ì â ì¬íê°
â Score ⥠80: Phase 3ì¼ë¡ ì§í
â Score < 80: feedback ìì§
Iteration 3: ìµì¢
ìì â ì¬íê°
â Score ⥠80: Phase 3ì¼ë¡ ì§í
â Score < 80: íì¬ ìµì ë²ì ì¼ë¡ ì§í + ì´ì ë³´ê³
Phase 3: Document Update
ì¶ê° ê·ì¹
- Append Only: 기존 ë´ì© ë¤ì ì ì¹ì ì¶ê°. 기존 ë´ì© ìì ê¸ì§.
- [NEW] íê·¸: ìë¡ ì¶ê°ë ì¤íì
[NEW]íê·¸ íì (ë¤ì ì ë°ì´í¸ ì ì ê±°) - 구ë¶ì : ì ì¤í ì ì
---구ë¶ì ì½ì - ë ì§ í기: ì¤í ì¤í ë ì§ (ë¡ê·¸ íìì¤í¬í 기ë°)
- ì¼ê´ë í¬ë§·: references/interpretation-template.md í í릿 ì¤ì
[NEW] íê·¸ ì²ë¦¬
---
### [NEW] Experiment: {experiment_name} ({YYYY-MM-DD})
...
ë¤ì /update-study ì¤í ì:
- ì´ì ì ì¶ê°ë
[NEW]íê·¸ 모ë ì ê±° - ìë¡ ì¶ê°ëë ì¹ì
ìë§
[NEW]íê·¸ ë¶ì¬
Phase 4: Verification (experiment-verifier)
Task Tool í¸ì¶
Task tool ì¬ì©:
- subagent_type: "experiment-verifier"
- prompt:
"ë¤ì study.md ì
ë°ì´í¸ ë´ì©ì ê²ì¦í´ì£¼ì¸ì.
## ê²ì¦ ëì (ìë¡ ì¶ê°ë ì¹ì
)
{Phase 3ìì ì¶ê°í ë´ì©}
## ì본 ë¡ê·¸ íì¼ ê²½ë¡
{ê° ë¡ê·¸ íì¼ì ì ì²´ ê²½ë¡}
## 기존 study.md (ë³ê²½ ì¬ë¶ íì¸ì©)
{기존 study.md ë´ì©}
## ê²ì¦ ì구ì¬í
1. 모ë ìì¹ë¥¼ ì본 ë¡ê·¸ì ëì¡° (íì¼:ë¼ì¸ ì§ì íì¸)
2. í´ìì ë
¼ë¦¬ì íë¹ì± ê²ì¦
3. 모ë ê°ì¤ì falsifiability íì¸
4. ë¤ì ì¤íì ì¤í ê°ë¥ì± íì¸
5. 기존 ê²°ê³¼ ë³ê²½ ì¬ë¶ íì¸
## ì¶ë ¥
JSON íìì ê²ì¦ ë³´ê³ ì를 ë°íí´ì£¼ì¸ì."
ê²°ê³¼ ì²ë¦¬
if verdict == "PASS":
# Phase 5ë¡ ì§í
elif iteration < 3:
# feedback_summary를 Phase 2ë¡ ì ë¬
# interpreterìê² ìì ìì²
else:
# ìµë ë°ë³µ ëë¬
# íì¬ ìµì ë²ì ì ì¥
# 미í´ê²° ì´ì ì¬ì©ììê² ë³´ê³
Phase 5: Export (NEW)
Step 5.1: Markdown íì
1. study.md ìµì¢
ë´ì© ì ì¥
2. [NEW] íê·¸ê° í¬í¨ë ì¹ì
íì¸
Step 5.2: PDF ë³í
scripts/export_pdf.py ì¬ì©:
python scripts/export_pdf.py study.md study.pdf
ë³í ìµì
:
- TOC (Table of Contents) í¬í¨
- [NEW] íê·¸ ìê°ì ê°ì¡° (ë
¸ëì íì´ë¼ì´í¸)
- í
ì´ë¸ ê¹ëí í¬ë§·í
- ì½ë ë¸ë¡ ë¬¸ë² ê°ì¡°
Fallback ìì:
1. pandoc + LaTeX (ìµìì íì§)
2. weasyprint (pandoc ìì ì)
3. Markdownë§ ì ì¥ (PDF ë³í ì¤í¨ ì ê²½ê³ )
Step 5.3: ìë£ ë³´ê³
â
Update Complete!
ð Markdown: study.md
ð PDF: study.pdf (optional)
ð New experiments: {N}ê°
ð¬ Hypotheses: {N}ê°
𧪠Next experiments: {N}ê°
Progress Reporting
ì¤í ì¤ ì¬ì©ììê² ìí를 ë³´ê³ í©ëë¤:
[Phase 0] Incremental Detection...
â Scanned logs/: {N}ê° íì¼
â Already documented: {M}ê° ì¤í
â New experiments: {K}ê° ë°ê²¬
[Phase 1] File Verification...
â ë¡ê·¸ íì¼ íì¸: {K}ê°
â study.md ì½ê¸° ìë£
[Phase 2] Interpretation...
â ìì¹ ì¶ì¶: {N}ê° ë©í¸ë¦
â ë¹êµ í
ì´ë¸ ìì±
[Phase 2b] Writing Quality Loop...
â Iteration 1: Score 72/100
- Critical: Definition missing (2)
- Warning: Topic-last paragraph (1)
â Iteration 2: Score 85/100
â All critical issues resolved
[Phase 3] Document Update...
â ì ì¹ì
ì¶ê° ([NEW] íê·¸)
[Phase 4] Verification...
â Numerical: {verified}/{total}
â Logic: {sound}/{total}
â Verdict: PASS
[Phase 5] Export...
â PDF ë³í ìë£
â
Complete!
- New experiments: {experiment_names}
- Accuracy: {X.XX%}
- Hypotheses: {N}ê°
- Next experiments: {N}ê°
Quality Criteria Summary
| Criterion | Weight | Pass Threshold |
|---|---|---|
| Definition-First | 30ì | ì©ì´ 100% ì ì |
| Topic-First | 25ì | ë¬¸ë¨ 90% ëê´ì |
| Compare-Contrast | 20ì | ë¹êµ í ì´ë¸ íì |
| Insight Depth | 15ì | “ì” ë¶ì í¬í¨ |
| Minimal Adjectives | 10ì | ìì¹ ê¸°ë° íí |
Overall Pass: ⥠80ì
Additional Resources
references/interpretation-template.md– ì¤í í´ì í í릿references/quality-criteria.md– ê¸ íì§ íê° ìì¸ ê¸°ì¤scripts/export_pdf.py– PDF ë³í ì í¸ë¦¬í°
Cautions
- ë¡ê·¸ íì¼ì´ ground truth: ë¡ê·¸ì ìë ìì¹ë ì¬ì© ë¶ê°
- Append Only: ì´ì 결과를 ì ë ìì íì§ ìì
- 매 ìì¹ì ì¶ì²:
(source: filepath:Líë²í¸)íì - ê°ì¤ì falsifiable: ê²ì¦ ë¶ê°ë¥í ê°ì¤ì ìì
- ìµë 3í ë°ë³µ: 무í 루í ë°©ì§
- ì ì¤í ì°ì : ì´ë¯¸ 문ìíë ì¤íì ìë ì¤íµ
- [NEW] íê·¸: ì ì¶ê°ë¶ ëª íí íì