ghost-archive

'아카이브'라는 단어의 용례 수집

수집 방법론

수집 범위

언어: 한국어, 영어
키워드: 아카이브, 아카이빙, archive, archiving, archived
기간: 2026년 4월~

수집 소스

소스	방식	주기
Google News	RSS 자동 수집	매일
네이버 뉴스	API 자동 수집	매일
Are.na	수동 수집	비정기

자동 수집 프로세스

GitHub Actions가 매일 09:00 KST에 실행
각 소스에서 키워드 검색
중복 제거 후 JSON 저장
자동 커밋

분류 체계

수집된 용례는 Gemini 2.5 Flash 모델로 자동 분류된다. 제목 기반으로 7개 카테고리 중 하나를 부여한다.

마케팅 — 브랜드 헤리티지, 컬렉션, 빈티지, 패션, 굿즈
감성 — 힙함, 구별짓기, 레트로, 추억, 향수
큐레이션 — 선별, 플레이리스트, 콘텐츠 모음
시민 — 대항 기억, 커뮤니티 기록, 구술, 사회운동
제도 — 공공기록, 도서관, 법적 보존, 기관
기술 — 백업, 압축, 버전관리, 소프트웨어
예술 — 전시, 미술관, 영화, 음악, 창작 재료, 형식 실험

데이터 스키마

{
  "id": "ghost-2026-04-26-xxxxx",
  "source_type": "news",
  "source_url": "https://...",
  "source_title": "제목",
  "collected_at": "2026-04-26",
  "published_at": "2026-04-26",
  "keyword": "아카이브",
  "language": "ko | en",
  "auto_collected": true,
  "reviewed": false,
  "category": null,
  "implied_meaning": null,
  "note": null
}

오픈소스

수집 스크립트와 데이터는 모두 GitHub에 공개되어 있다.