Question 1

LLM 위키와 RAG의 근본 차이는 무엇인가?

Accepted Answer

RAG는 질문 시점에 chunk를 vector 유사도로 retrieval하는 즉석·휘발성 구조입니다. LLM 위키는 LLM이 entity와 relation을 사전에 추출해 graph DB에 영구 누적하고, 시간이 지날수록 지식이 진화·재인덱싱됩니다. 단발성 QA에는 RAG가, 도메인 지식이 누적되어야 하는 환경에는 LLM 위키가 맞습니다.

Question 2

기존 RAG 파이프라인에서 LLM 위키로 어떻게 이행하는가?

Accepted Answer

기존 chunk·embedding은 그대로 두고 그 위에 entity·relation 추출 단계를 Producer로 분리해 추가합니다. Neo4j 같은 graph DB에 노드·엣지를 적재한 뒤, retriever를 단일 vector top-k에서 vector·cypher·text2cypher 멀티 라우터로 확장하면 점진적 마이그레이션이 가능합니다.

Question 3

Producer/Consumer 분리가 왜 필요한가?

Accepted Answer

Producer(ingest·indexing)와 Consumer(query·response)를 분리하면 embedding을 한 번만 계산해 재활용할 수 있고, indexing 비용을 query latency와 무관하게 백그라운드로 흘릴 수 있습니다. 위키가 커질수록 재인덱싱 비용이 0에 가까워야 운용이 가능하기 때문에 분리가 사실상 필수입니다.

Question 4

Agentic RAG 3-router(VectorRetriever / VectorCypherRetriever / Text2CypherRetriever)는 언제 무엇이 선택되는가?

Accepted Answer

VectorRetriever는 의미 기반 fuzzy 질의(개념·요약)에, VectorCypherRetriever는 의미로 진입한 뒤 그래프 traversal로 관계를 따라가는 질의에, Text2CypherRetriever는 정밀한 구조적 질문(특정 entity의 속성·집계)에 선택됩니다. universe.habix.ai에서는 라우터 LLM이 질문 형태를 보고 셋 중 하나를 자동 라우팅합니다.

Question 5

1인 운영자에게 LLM 위키가 의미 있는 이유는?

Accepted Answer

1인이 다루는 도메인은 좁고 깊으며 시간에 따라 누적됩니다. 매번 새 문서를 던지는 RAG보다, 지식이 자동으로 entity·relation 그래프로 흡수되어 질의 가능한 형태로 누적되는 LLM 위키가 훨씬 적합합니다. 일종의 "외장된 도메인 뇌" 역할입니다.

Question 6

LLM 위키를 직접 만들려면 어떤 스택이 필요한가?

Accepted Answer

최소 구성은 (1) entity·relation 추출용 LLM(Claude·GPT·Gemini), (2) graph DB(Neo4j 또는 Memgraph), (3) vector store(pgvector·Qdrant·Weaviate), (4) retriever 라우팅 레이어(LangGraph·LlamaIndex), (5) ingestion orchestrator(cron 또는 워크플로 엔진)입니다. universe.habix.ai는 Neo4j + Python FastAPI + Cypher retriever 조합으로 구성됩니다.

Question 7

embedding 비용은 어느 정도인가?

Accepted Answer

Producer/Consumer 분리 구조에서 embedding은 ingest 시점에 1회만 계산하면 됩니다. 1024+ chunk 규모에서 OpenAI text-embedding-3-small 기준 1회 인덱싱 비용은 1달러 미만이며, 이후 재인덱싱은 변경분만 처리하기 때문에 운용 비용은 사실상 0에 수렴합니다.

Question 8

노션·옵시디언과 LLM 위키는 어떤 관계인가?

Accepted Answer

노션·옵시디언은 사람이 직접 편집하는 wiki이고, LLM 위키는 LLM이 entity·relation 추출·연결을 자동화하는 시스템입니다. 두 층은 보완 관계로, 옵시디언 vault를 source로 두고 LLM 위키가 그 위에 graph 인덱스를 얹는 구성이 가장 흔합니다.

Question 9

LLM 위키와 일반 KG(Knowledge Graph)는 어떻게 다른가?

Accepted Answer

전통 KG는 사람이 ontology를 설계하고 entity·relation을 수기 입력하는 구조입니다. LLM 위키는 ontology를 LLM이 자동 유도하고, entity·relation 추출·정규화도 LLM이 수행하며 자연어 질의를 Cypher로 변환해 retrieval합니다. 결과적으로 도메인 변화에 대한 적응 비용이 한 자릿수 이상 낮습니다.

Question 10

LLM 위키 콘텐츠는 학습 데이터로 노출되는가?

Accepted Answer

habix.ai의 LLM 위키 운영 정책은 ai-input(검색·답변 인용)은 허용하되 ai-train(학습 데이터 수집)은 비허용입니다. robots.txt와 Content-Signal 헤더로 명시하며, universe.habix.ai도 동일 정책을 따릅니다.

축	RAG	LLM 위키
지식 수명주기	질문 시점 즉석 retrieval · 휘발성 · 응답 끝나면 사라짐	영구 누적 + 재인덱싱 · graph DB에 entity·relation 보존 · 시간 누적
구조	chunk → embedding → vector top-k	entity·relation 그래프 + 멀티 retriever 라우팅 (universe.habix.ai의 Producer/Consumer + Agentic RAG 3-router가 실증)
언제 쓰는가	단발성 QA · 문서 검색 · 사전 지식 적은 일회성 질의	도메인 지식이 누적·진화하는 1인/팀 context · 외장된 도메인 뇌

LLM 위키란 무엇인가

// 01 · comparisonLLM 위키 vs RAG

// 02 · context왜 지금 LLM 위키인가

// 03 · architectureProducer/Consumer 분리 아키텍처를 적용한 LLM 위키

Producer — 사전 ingest 파이프라인

Consumer — Agentic RAG 3-router 질의 레이어

// 04 · live proof실전 사례: universe.habix.ai

// 05 · faq자주 묻는 질문

읽기보다 직접 만져보는 게 빠릅니다