수집 방법론
수집 범위
- 언어: 한국어, 영어
- 키워드: 아카이브, 아카이빙, archive, archiving, archived
- 기간: 2026년 4월~
수집 소스
| 소스 | 방식 | 주기 |
|---|---|---|
| Google News | RSS 자동 수집 | 매일 |
| 네이버 뉴스 | API 자동 수집 | 매일 |
| Are.na | 수동 수집 | 비정기 |
자동 수집 프로세스
- GitHub Actions가 매일 09:00 KST에 실행
- 각 소스에서 키워드 검색
- 중복 제거 후 JSON 저장
- 자동 커밋
분류 체계 (검토 후 적용)
수집된 용례는 검토 후 다음 카테고리로 분류될 예정:
- 마케팅 — 브랜드 헤리티지, 컬렉션, 빈티지, 패션, 굿즈
- 감성 — 힙함, 구별짓기, 레트로, 추억, 향수
- 큐레이션 — 선별, 플레이리스트, 콘텐츠 모음
- 시민 — 대항 기억, 커뮤니티 기록, 구술, 사회운동
- 제도 — 공공기록, 도서관, 법적 보존, 기관
- 기술 — 백업, 압축, 버전관리, 소프트웨어
- 예술 — 전시, 미술관, 영화, 음악, 창작 재료, 형식 실험
데이터 스키마
{
"id": "ghost-2026-04-26-xxxxx",
"source_type": "news",
"source_url": "https://...",
"source_title": "제목",
"collected_at": "2026-04-26",
"published_at": "2026-04-26",
"keyword": "아카이브",
"language": "ko | en",
"auto_collected": true,
"reviewed": false,
"category": null,
"implied_meaning": null,
"note": null
}
참고 사례
- Bad Archives — 문제적 아카이브 사례 수집
- Word Watch — 단어 용례 수집
- Digital Gardens — 디지털 가든 사례 수집
오픈소스
수집 스크립트와 데이터는 모두 GitHub에 공개되어 있다.