ghost-archive

'아카이브'라는 단어의 용례 수집

수집 방법론

수집 범위

수집 소스

소스 방식 주기
Google News RSS 자동 수집 매일
네이버 뉴스 API 자동 수집 매일
Are.na 수동 수집 비정기

자동 수집 프로세스

  1. GitHub Actions가 매일 09:00 KST에 실행
  2. 각 소스에서 키워드 검색
  3. 중복 제거 후 JSON 저장
  4. 자동 커밋

분류 체계

수집된 용례는 Gemini 2.5 Flash 모델로 자동 분류된다. 제목 기반으로 7개 카테고리 중 하나를 부여한다.

데이터 스키마

{
  "id": "ghost-2026-04-26-xxxxx",
  "source_type": "news",
  "source_url": "https://...",
  "source_title": "제목",
  "collected_at": "2026-04-26",
  "published_at": "2026-04-26",
  "keyword": "아카이브",
  "language": "ko | en",
  "auto_collected": true,
  "reviewed": false,
  "category": null,
  "implied_meaning": null,
  "note": null
}

오픈소스

수집 스크립트와 데이터는 모두 GitHub에 공개되어 있다.