지식 관리 (Knowledge)
D.Hub의 Knowledge 모듈은 비정형 데이터를 검색 가능한 지식으로 변환하는 플랫폼입니다.
핵심 기능
Knowledge 모듈은 다음 기능을 제공합니다:
- 문서 수집: 웹 크롤링, 파일 업로드, 수동 입력 등 다양한 소스에서 데이터를 수집합니다
- AI 채팅: RAG(Retrieval-Augmented Generation) 기반으로 수집된 지식에 대해 AI와 대화합니다
- 검색 테스트: Vector, Full-Text, Hybrid 검색 모드로 지식의 품질을 검증합니다
- Knowledge 설정: 저장소 타겟, 임베딩 모델, 메타데이터를 관리합니다
데이터 소스
Knowledge는 세 가지 방법으로 데이터를 수집할 수 있습니다:
| 소스 | 설명 | 지원 형식 |
|---|---|---|
| 웹 크롤링 | URL을 기반으로 웹 페이지를 자동 수집 | HTML, 동적 페이지 (JS 렌더링) |
| 파일 업로드 | 문서 파일을 직접 업로드하여 처리 | PDF, DOCX, PPTX, XLSX, HTML, TXT, MD |
| 수동 입력 | 텍스트 청크를 직접 작성하여 등록 | 자유 형식 텍스트 |
다중 저장소 아키텍처
수집된 데이터는 용도에 따라 최대 세 가지 저장소에 동시 저장됩니다:
| 저장소 | 엔진 | 용도 |
|---|---|---|
| Vector DB | 벡터 검색 엔진 | 의미 기반 유사도 검색 (임베딩 벡터) |
| Text DB | 텍스트 검색 엔진 | 키워드 기반 전문 검색 (BM25) |
| Graph DB | 그래프 데이터베이스 | 엔티티/관계 기반 그래프 탐색 |
팁
Knowledge 생성 시 저장소 타겟을 선택할 수 있습니다. 대부분의 경우 Vector + Text 조합이 가장 효과적입니다.
Knowledge 상세 화면
Knowledge를 선택하면 다음 4개 탭으로 구성된 상세 화면이 표시됩니다:
| 탭 | 설명 |
|---|---|
| Documents | 수집된 문서 목록 관리 및 새 문서 추가 |
| Chat | RAG 기반 AI 채팅으로 지식에 질문 |
| Search | 검색 쿼리를 테스트하고 결과 품질 확인 |
| Settings | 메타데이터, 저장소 옵션, 임베딩 모델 관리 |