86370f6c1e
- FastEmbedSparse(Qdrant/bm25) 기반 sparse 임베딩 추가 (fastembed 패키지) - IngestionService: HYBRID_SEARCH_ENABLED 시 dense + sparse 동시 저장 (RetrievalMode.HYBRID) - _ensure_collection_schema(): sparse vector 미설정 컬렉션 자동 삭제·재생성 - RetrieverService: hybrid 스토어 + dense 폴백 구조, Qdrant 내장 RRF로 결과 통합 - container.py: sparse_embeddings Singleton 프로바이더, ingestion/retriever 양쪽 주입 - .env.example: HYBRID_SEARCH_ENABLED, SPARSE_MODEL_ID 항목 추가 활성화: .env에 HYBRID_SEARCH_ENABLED=true 설정 후 기존 문서 재수집 필요 Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>
22 lines
550 B
Bash
22 lines
550 B
Bash
# LLM 모델 설정
|
|
MODEL_ID=mlx-community/Qwen3-8B-4bit
|
|
MAX_TOKENS=1024
|
|
MAX_HISTORY_TURNS=30
|
|
COMPACT_THRESHOLD=40
|
|
|
|
# MySQL 설정 (미설정 시 DB 기능 비활성화)
|
|
DB_HOST=localhost
|
|
DB_PORT=3306
|
|
DB_NAME=youlbot
|
|
DB_USER=
|
|
DB_PASSWORD=
|
|
|
|
# LangSmith 트레이싱 (Phase 7) — https://smith.langchain.com 에서 API 키 발급
|
|
LANGCHAIN_TRACING_V2=false
|
|
LANGCHAIN_API_KEY=
|
|
LANGCHAIN_PROJECT=youlbot
|
|
|
|
# Hybrid Search (Phase 18) — BM25 + Vector (활성화 후 기존 문서 재수집 필요)
|
|
HYBRID_SEARCH_ENABLED=false
|
|
SPARSE_MODEL_ID=Qdrant/bm25
|