okayJingmemorylocal-llmevaluationreranking

로컬 LLM worker를 믿기 전에 — summary, classification, reranking 평가 기준

2026년 6월 14일5분 읽기

0. 로컬 모델을 붙이면 자동으로 똑똑해질까

맥미니에 저장공간과 local inference 여지가 생기면서 자연스럽게 다음 질문이 생겼다. memory warehouse에 local LLM worker를 붙이면 오케이징이 더 똑똑해지지 않을까. summary를 만들고, 문서를 분류하고, 검색 결과를 reranking하면 작업 시작 품질이 좋아질 것처럼 보였다.

그런데 여기서 바로 worker를 믿으면 위험하다. local model이 만든 요약은 그럴듯할 수 있지만, 그럴듯함이 곧 정확함은 아니다. 특히 memory에서 틀린 요약은 일반적인 답변 오류보다 더 오래 남는다. 한 번 잘못 들어간 summary가 다음 context pack의 재료가 되고, 그 다음 작업의 판단 근거가 될 수 있다.

1. 먼저 맡길 일과 맡기면 안 되는 일을 나눈다

local LLM worker에게 처음부터 모든 판단을 맡기면 안 된다. 먼저 deterministic하게 확인할 수 있는 일과, 모델의 보조 판단이 필요한 일을 나눠야 한다.

작업	local LLM에 맡길 수 있는가	기준
파일 존재, 경로, git 상태	아니오	도구 결과가 권위다
source chunk 검색	보조 가능

로컬 LLM worker를 믿기 전에 — summary, classification, reranking 평가 기준

로컬 LLM worker를 믿기 전에 — summary, classification, reranking 평가 기준

0. 로컬 모델을 붙이면 자동으로 똑똑해질까

1. 먼저 맡길 일과 맡기면 안 되는 일을 나눈다

오케이징에게 물어보기

포스트 목록

같은 섹션의 대표 이미지

Gemma4 e2b를 감으로 믿지 않기 — fixture와.

2. summary 평가는 누락을 먼저 본다

3. classification은 label set이 먼저다

4. reranking은 recall을 망치면 실패다

5. 이번에 얻은 기준

Graphify를 memory로 두지 않기로 했다 — 관계는.

기억이 skill을 자동으로 고치면 안 되는 이유.

벡터 검색을 지금 붙이지 않는 이유 — FTS와 source.

로컬 LLM worker를 믿기 전에 —.

오래된 기억을 어떻게 믿을 것인가 — stale-check와.

작업 시작 전에 기억을 먼저 조회한다 — hermes-memory.

맥미니 M4 2TB를 산 이유 — 오케이징의 기억은 디스크에서.

context pack은 요약본이 아니다 — 오케이징.

기억은 요약이 아니라 증거여야 했다 — local-first.

Honcho를 다시 검토할 때 — 오케이징의 장기 기억을.

오케이징의 기억은 하나가 아니다 — memory,.