Knowledge 관리
Knowledge는 비정형 데이터를 구조화된 지식으로 변환하는 기본 단위입니다. 웹 페이지, 문서 파일, 직접 작성한 텍스트 등 다양한 소스에서 데이터를 수집하고, 이를 검색 가능한 형태로 가공하여 저장합니다. 하나의 Knowledge는 특정 주제나 도메인에 대한 지식 베이스 역할을 합니다.
Knowledge 관리 화면에서는 Knowledge를 생성하고, 문서를 수집하며, RAG 기반 AI Chat으로 수집된 지식에 질문할 수 있습니다. 이 문서에서는 Knowledge 목록 화면의 구성, 새 Knowledge 생성 방법, 상세 화면의 탭 구조, 그리고 삭제 방법까지 전체 관리 흐름을 안내합니다.
Knowledge 목록 화면
/knowledge 경로에서 전체 Knowledge 목록을 확인할 수 있습니다. 목록은 테이블을 기본으로 하며, 각 Knowledge의 인덱싱 상태를 집계하여 함께 표시합니다.
검색 및 필터링
목록 상단의 검색 바로 Knowledge 이름·별칭을 검색할 수 있으며, 태그 필터와 소유자 표시로 특정 분류의 Knowledge만 좁혀 볼 수 있습니다.
Knowledge 수가 많아지면 태그를 체계적으로 관리하는 것이 검색 효율에 큰 도움이 됩니다. 팀 내에서 태그 네이밍 규칙을 사전에 정하는 것을 권장합니다.
표시 항목
각 행에는 다음 정보가 표시됩니다.
| 항목 | 설명 |
|---|---|
| 이름 / 별칭 | Knowledge의 시스템 이름과 사용자 표시용 별칭 |
| 집계 인덱싱 상태 | 소속 문서 전반의 인덱싱 상태 요약 (아래 참고) |
| 문서 수 / 청크 수 | 수집된 문서와 청크의 총 개수 |
| 컬렉션 | 연결된 컬렉션 |
| 소유자 | Knowledge 소유자 |
| 태그 | 분류 태그 |
| 생성/수정일 | 생성 시점과 최근 수정 시점 |
집계 인덱싱 상태 (Aggregate Indexing Status)
각 Knowledge에는 소속 문서들의 상태를 요약한 집계 상태가 배지로 표시됩니다. 개별 문서의 상태를 모두 확인하지 않고도 지식 베이스 전체 상태를 한 번에 파악할 수 있습니다.
| 집계 상태 | 의미 |
|---|---|
| 문서 없음 (EMPTY) | 아직 수집된 문서가 없음 |
| 처리 중 (PROCESSING) | 한 건 이상이 인덱싱 중 (재인덱싱 포함) |
| 완료 (COMPLETED) | 모든 문서가 인덱싱 완료 상태 |
| 실패 (FAILED) | 하나 이상의 문서가 실패 상태 — 상세 확인 필요 |
| 알 수 없음 (UNKNOWN) | 상태를 판단할 수 없음 (서버 응답 이상 등) |
집계가 처리 중 (PROCESSING) 인 항목은 주기적으로 폴링되어 자동 갱신됩니다.
Knowledge 생성
Knowledge는 두 곳에서 생성할 수 있으며, 두 진입점 모두 같은 폼 컴포넌트를 공유합니다 — 입력 항목·검증·AI 자동 생성 동작이 동일합니다.
- 목록 페이지의
+ Knowledge버튼: 일반 생성 다이얼로그. - 컬렉션 상세에서
+ 항목 추가 ▾ → 지식: 컬렉션 컨텍스트가 자동으로 잠긴 상태로 다이얼로그가 열립니다.
컬렉션 상세 헤더의 + 항목 추가 ▾ → 지식 흐름으로 진입한 Knowledge 생성 다이얼로그. 잠긴 컬렉션 칩이 보여야 합니다.
생성 필드
| 필드 | 필수 | 설명 |
|---|---|---|
| 이름 | ✅ | Knowledge의 고유 이름입니다. 영문 소문자로 시작하고 소문자·숫자·밑줄(_) 사용을 권장합니다. |
| 별칭 | 사용자 표시용 별칭입니다. 목록·검색에서 1차 라벨로 사용됩니다. | |
| 컬렉션 | 연결할 컬렉션을 선택합니다. 기존 컬렉션과 연계하여 리소스를 체계적으로 관리할 수 있습니다. | |
| 설명 | Knowledge의 용도나 포함 내용에 대한 설명 텍스트입니다. | |
| 임베딩 모델 | 사용할 임베딩 모델을 선택합니다. 각 모델별로 dimensions(차원 수)와 provider 정보가 함께 표시됩니다. | |
| 저장소 타겟 | VECTOR, TEXT, GRAPH 중 하나 이상을 선택합니다. 복수 선택이 가능합니다. | |
| 태그 | 분류 및 검색을 위한 태그를 지정합니다. |
저장소 타겟 상세
| 타겟 | 엔진 | 용도 | 현재 상태 |
|---|---|---|---|
| 시맨틱 검색 (VECTOR) | 벡터 DB | 임베딩 벡터 기반 의미 유사도 검색 | 기본 권장 |
| 키워드 검색 (TEXT) | 텍스트 검색 엔진 | BM25 기반 키워드 전문 검색 | 기본 권장 |
| 지식 그래프 (GRAPH) | 그래프 DB | 엔티티·관계 기반 그래프 탐색 | 현재 선택 비활성 (향후 제공) |
대부분의 경우 VECTOR + TEXT 조합이 가장 효과적입니다. Vector 검색으로 의미적 유사성을 확보하고, Text 검색으로 키워드 정확도를 보완하여 Hybrid 검색 품질을 극대화할 수 있습니다. GRAPH 옵션은 현재 생성 화면에서 비활성 상태로 노출되며 향후 업데이트에서 활성화될 예정입니다.
모든 필드를 입력한 후 Create 버튼을 클릭하면 Knowledge가 생성되고, 상세 화면으로 자동 이동합니다.
Knowledge 상세 화면
/knowledge/:knowledgeId 경로에서 개별 Knowledge의 상세 정보를 확인하고 관리할 수 있습니다.
헤더 영역
상세 화면 상단에는 다음 정보가 표시됩니다:
- Knowledge 이름: 현재 Knowledge의 이름
- 문서 수: 수집된 전체 문서 개수
- 청크 수: 분할된 전체 청크 개수
탭 구성
상세 화면은 4개의 탭으로 구성됩니다:
문서 (Documents) 탭
Knowledge에 수집된 문서 목록을 관리하는 기본 탭입니다. 각 문서의 제목, 소스 유형, 청크 수, 상태를 확인할 수 있습니다.
새 문서 추가 드롭다운 버튼을 통해 세 가지 방식으로 문서를 추가할 수 있습니다:
| 추가 방식 | 설명 |
|---|---|
| 웹 크롤링 | URL을 입력하여 웹 페이지를 자동으로 수집합니다. JavaScript 렌더링이 필요한 동적 페이지도 지원합니다. |
| 파일 업로드 | PDF, DOCX, PPTX, XLSX, HTML, TXT, MD 등 다양한 형식의 문서 파일을 직접 업로드합니다. |
| 수동 입력 | 텍스트 청크를 직접 작성하여 등록합니다. 간단한 지식이나 FAQ 형태의 데이터에 적합합니다. |
각 문서 추가 방식에 대한 자세한 사용법은 하위 문서에서 확인할 수 있습니다.
채팅 (Chat) 탭
RAG(Retrieval-Augmented Generation) 기반 AI 채팅 인터페이스입니다. 수집된 지식을 바탕으로 AI에게 질문하고 답변을 받을 수 있습니다. 답변에는 참조한 소스 문서 정보가 함께 표시되어 근거를 확인할 수 있습니다.
채팅 탭은 수집된 문서의 품질을 간편하게 검증하는 용도로도 활용할 수 있습니다. 기대하는 답변이 나오지 않는다면 문서 청킹 옵션이나 검색 모드를 조정해 보세요.
검색 (Search) 탭
수집된 지식의 검색 품질을 테스트하는 탭입니다. 검색 쿼리를 입력하고 Vector, Text, Hybrid 등 다양한 검색 모드로 결과를 확인할 수 있습니다. 검색 결과의 관련도 점수와 매칭된 청크를 직접 확인하여 지식 품질을 검증할 수 있습니다.
설정 (Settings) 탭
Knowledge의 메타데이터 및 설정 옵션을 관리하는 탭입니다. 다음 항목을 관리할 수 있습니다:
- 기본 정보: 이름, 설명, 태그 수정
- 저장소 설정: 활성화된 저장소 타겟 확인
- 임베딩 모델: 현재 적용된 임베딩 모델 및 차원 수 확인
- 위험 영역: Knowledge 삭제 등 비가역적 작업
Knowledge 삭제
더 이상 필요하지 않은 Knowledge를 삭제할 수 있습니다.
- 비어 있는 Knowledge: 수집된 문서가 없으면 바로 삭제됩니다.
- 문서가 있는 Knowledge: 하위 문서가 남아 있으면 삭제 시 충돌(conflict) 안내가 표시됩니다. 안내에서 전체 삭제(cascade)를 선택하면 저장소의 청크를 정리하고 모든 문서를 제거한 뒤 Knowledge를 삭제합니다.
전체 삭제(cascade)를 실행하면 해당 Knowledge에 속한 모든 문서와 청크(Vector·Text 저장소 포함)가 함께 영구 삭제됩니다. 이 작업은 되돌릴 수 없으므로 삭제 전 반드시 확인하세요. 중요한 데이터가 포함된 Knowledge는 삭제 전에 백업을 권장합니다.
다음 단계
Knowledge를 생성한 후, 다양한 방법으로 문서를 수집하고 활용할 수 있습니다:
| 문서 | 설명 |
|---|---|
| 웹 크롤링 | URL 기반 웹 페이지 자동 수집 |
| 파일 업로드 | 문서 파일 업로드 및 처리 |
| 수동 문서 | 텍스트 청크 직접 작성 |
| AI 채팅 | RAG 기반 대화로 지식 활용 |