Version: Next

AI 채팅

Knowledge 상세 화면의 채팅 (Chat) 탭에서는 수집된 문서 데이터를 기반으로 AI와 대화할 수 있습니다. 단순한 챗봇이 아니라, 사용자가 축적한 Knowledge를 검색하고 그 결과를 바탕으로 답변을 생성하는 방식으로 동작합니다. 따라서 AI가 임의로 지어낸 답변이 아닌, 실제 수집된 문서에 근거한 정확한 응답을 받을 수 있습니다.

이 기능은 RAG(Retrieval-Augmented Generation) 파이프라인을 통해 구현됩니다. 사용자의 질문이 입력되면 먼저 관련 문서 청크를 검색(Retrieval)한 뒤, 검색된 컨텍스트를 LLM에 전달하여 답변을 생성(Generation)합니다. 각 답변에는 참조한 출처 정보가 함께 표시되어, 답변의 근거를 직접 확인하고 검증할 수 있습니다.

화면 구조

AI 채팅 화면은 세 개의 패널로 구성되어 있습니다(화면이 좁으면 좌·우 패널은 드로어로 전환됩니다).

왼쪽 패널 — 대화 세션 목록

이전 대화 내역을 관리하는 영역입니다.

기능	설명
새 대화	새로운 세션을 시작합니다.
검색	세션 목록 상단의 검색 필드에서 대화 제목으로 이전 세션을 검색합니다.
상대 시각 표시	각 세션에는 마지막 활동 시각이 상대 표기(예: 방금 전, N분 전, 날짜)로 표시됩니다.
세션 삭제	각 세션 항목에서 개별 삭제할 수 있습니다.

중앙 영역 — 채팅 메시지

실제 대화가 이루어지는 핵심 영역입니다.

사용자 메시지: 입력한 질문이 말풍선 형태로 표시됩니다.
AI 응답: 검색된 문서 컨텍스트를 바탕으로 생성된 답변이 마크다운 형식으로 렌더링됩니다.
인용 pill: 답변 내에 참조한 출처가 pill로 표시됩니다. 클릭하여 원문을 확인할 수 있습니다.
입력 필드: 화면 하단의 텍스트 입력 영역에서 질문을 작성하고 전송합니다. Enter 키로 전송하며, Shift + Enter로 줄바꿈할 수 있습니다.

하단 설정 바 — RAG 전략 / Wrapper Retriever / 모델

채팅 입력 바로 위의 설정 바에서 RAG 전략, Wrapper Retriever 토글, 사용할 LLM 모델을 선택합니다. 각 설정은 다음 메시지부터 즉시 적용됩니다.

오른쪽 패널 — 소스 필터

AI가 참조할 문서 범위를 제한하는 필터 영역입니다. 자세한 내용은 아래 소스 필터링 섹션을 참고하세요.

RAG 전략

RAG 전략은 사용자의 질문에 대해 어떤 방식으로 관련 문서를 검색할지 결정합니다. 채팅 설정 바에는 여러 옵션이 한 줄로 붙어 있는 선택 버튼이 있으며, 여기서 다음 3가지 중 하나를 선택합니다(한 번에 하나만 활성화됩니다).

전략	설명	추천 사용 사례
하이브리드 (hybrid)	벡터 검색과 텍스트 검색을 병렬로 수행한 뒤 Reciprocal Rank Fusion(RRF)으로 결과를 병합합니다. 의미 검색과 키워드 검색의 장점을 함께 활용합니다.	대부분의 질문 (기본값)
에이전틱 (agentic)	에이전트 기반 RAG입니다. LLM이 쿼리 리라이트, 문서 관련성 평가, 다단계 검색을 자율적으로 수행하고, 결과가 불충분하면 질문을 재작성해 다시 검색합니다.	모호한 질의, 단일 검색으로 답을 못 구하는 복잡한 질문
쿼리 분해 (query_decomposition)	복합 질문을 여러 하위 질문으로 분해한 뒤 각각에 대한 검색 결과를 합쳐 답변합니다.	"A의 매출과 B의 매출을 비교해줘"와 같은 다중 조건 질의

전략 선택 가이드

특별한 이유가 없다면 **하이브리드 (hybrid)**를 사용하세요. 애매하거나 다단계 추론이 필요한 질문에는 에이전틱 (agentic), 한 번에 여러 사실을 물어보는 복합 질문에는 **쿼리 분해 (query_decomposition)**가 효과적입니다.

저장소 타겟과 백엔드 정합

채팅의 RAG 전략은 hybrid / agentic / query_decomposition로 백엔드 옵션과 1:1로 정합되어 있습니다. 벡터만(vector), 텍스트만(text), 그래프만(graph) 사용한 순수 검색은 검색 테스트 화면에서 수행할 수 있습니다.

Wrapper Retriever (쿼리 확장 보강)

RAG 전략에 추가로 적용할 수 있는 쿼리 확장 보강 옵션입니다. 설정 바에서 개별 토글로 끄고 켭니다. 하나, 두 개, 또는 모두 켤 수 있습니다.

옵션	설명	적합한 상황
멀티쿼리 (multiquery)	LLM으로 유사한 질문 변형을 생성해 각 변형으로 추가 검색을 수행하고 결과를 병합합니다.	표현이 짧거나 애매한 질문, 동의어로 표현이 갈리는 도메인
확장 (expansion)	질문에서 핵심 키워드를 추출하고 유의어/관련어로 확장해 텍스트 검색을 강화합니다.	키워드 중심의 정확 검색을 강화하고 싶을 때

Wrapper Retriever를 켜면 호출하는 LLM 호출 수가 늘어나 응답 지연과 비용이 증가할 수 있습니다. 응답 품질이 민감한 시나리오에서만 선택적으로 사용하세요.

모델 선택

하단 설정 바의 모델 드롭다운에서 AI 응답 생성에 사용할 LLM을 선택합니다.

동적 목록: 사용 가능한 모델은 백엔드에서 동적으로 조회됩니다(하드코딩되어 있지 않습니다). 모델이 여러 Provider에 걸쳐 있으면 Provider별로 그룹화되어 표시됩니다.
단일 Provider 운영: Knowledge 채팅은 한 시점에 하나의 Provider(OpenAI, Claude 또는 OpenAI 호환 엔드포인트)로 동작합니다. 따라서 실제 표시되는 모델 목록은 시스템 구성에 따라 달라집니다.

note

표시되는 모델이 없거나 기대한 모델이 보이지 않으면 시스템 관리자에게 LLM Provider·키 설정을 확인하세요.

Temperature 컨트롤 없음

현재 Knowledge 채팅은 요청에 temperature·max_tokens 파라미터를 보내지 않습니다. 채팅 화면에 Temperature 슬라이더는 없습니다.

소스 필터링

오른쪽 패널의 소스 필터 섹션에서 AI가 참조할 문서의 범위를 제한할 수 있습니다.

동작 방식

전체 선택 (기본): 필터를 설정하지 않으면 Knowledge에 수집된 모든 문서를 대상으로 검색합니다.
특정 문서 선택: 체크박스로 원하는 문서만 선택하면, 해당 문서의 청크만 검색 대상에 포함됩니다.

활용 시나리오

시나리오	설정
Knowledge 전체에서 포괄적으로 검색	필터 없음 (전체 선택)
특정 보고서에 대해서만 질문	해당 보고서 문서만 체크
최신 문서 기반으로만 답변 받기	최근 수집된 문서만 체크
특정 소스 유형으로 한정	웹 크롤링/파일 업로드 등 원하는 유형만 체크

내부 동작

선택된 문서 ID 목록은 document_ids 파라미터로 검색 엔진에 전달됩니다. 벡터 검색과 텍스트 검색 모두 이 필터가 동일하게 적용되어, 선택한 문서 범위 밖의 청크는 검색 결과에 포함되지 않습니다.

인용 (Citation)

AI 응답의 신뢰성을 확보하기 위해, 답변에 사용된 출처가 인용 pill 형태로 표시됩니다.

인용 표시 형식

AI 응답 텍스트 내에 [1], [2] 등의 번호가 포함된 pill이 인라인으로 표시됩니다. 각 번호는 답변 생성에 참조된 문서 청크를 가리킵니다.

출처 확인

인용 pill을 클릭하면 출처 상세 모달이 열리며, 다음 정보를 확인할 수 있습니다:

항목	설명
문서명	출처가 된 원본 문서의 이름
섹션	문서 내 해당 청크가 속한 섹션 (있는 경우)
청크/페이지 번호	문서 내 청크 순번 또는 페이지 번호 (있는 경우)
원문 내용	실제 참조된 청크의 텍스트
관련도 점수	질문과의 관련도 점수 (%)

인용 활용

답변의 정확성을 원문 대조로 직접 검증할 수 있습니다.
여러 출처가 인용된 경우, 각 출처를 비교하여 정보의 일관성을 확인할 수 있습니다.
출처 문서를 기반으로 후속 질문을 구체적으로 작성할 수 있습니다.

tip

인용된 출처를 확인하는 습관은 AI 환각(hallucination)을 방지하는 가장 효과적인 방법입니다. 중요한 의사결정에 활용할 때는 반드시 원문을 확인하세요.

대화 관리

세션 저장 방식

대화 세션은 브라우저 로컬 스토리지에 저장됩니다. 서버에는 대화 내역이 저장되지 않으므로(stateless), 브라우저 데이터를 삭제하면 대화 기록도 함께 사라집니다.

세션 자동 타이틀링

새 대화를 시작하면 첫 번째 사용자 메시지의 앞 50자가 자동으로 세션 제목으로 설정됩니다. 세션 목록에서 해당 대화를 쉽게 식별할 수 있습니다.

세션 수 제한

항목	값
최대 세션 수	50개
초과 시 동작	가장 오래된 세션이 자동으로 삭제됩니다

warning

대화 내역은 브라우저 로컬 스토리지에만 저장되므로, 브라우저 변경, 시크릿 모드, 캐시 삭제 시 모든 대화 기록이 유실됩니다. 중요한 대화 내용은 응답 액션의 복사/공유 기능을 활용하여 별도로 보관하세요.

응답 액션

각 AI 응답 메시지 하단에는 다양한 액션 버튼이 제공됩니다.

각 AI 응답 메시지 하단에 다음 버튼이 표시됩니다.

액션	설명
복사	AI 응답 텍스트를 클립보드에 복사합니다.
좋아요 / 싫어요	응답 품질에 대한 피드백을 제공합니다. 향후 품질 개선에 활용됩니다.
노트로 저장	응답 내용을 노트로 저장하여 나중에 참조할 수 있습니다.
재생성 (Regenerate)	동일한 질문에 대해 새로운 답변을 생성합니다. 다른 관점의 답변을 원할 때 유용합니다.

응답이 스트리밍되는 동안에는 입력창의 중단(Stop) 버튼으로 생성을 즉시 멈출 수 있습니다. 대화 전체를 내보내는 공유는 채팅 상단 헤더에서 제공됩니다.

재생성 동작

재생성 시 직전 어시스턴트 응답을 제거하고 동일한 RAG 전략·모델 설정으로 다시 답변을 생성합니다.

효과적인 질문 작성 요령

AI 채팅에서 더 나은 답변을 얻기 위한 팁입니다.

방법	예시
구체적으로 질문	❌ "이 문서 요약해줘" → ✅ "이 문서에서 2024년 매출 목표를 알려줘"
맥락 제공	❌ "절차가 뭐야?" → ✅ "신규 직원 온보딩 절차를 단계별로 설명해줘"
출력 형식 지정	"핵심 포인트를 bullet list 형태로 정리해줘"
소스 필터 활용	관련 문서만 선택하여 검색 범위를 좁히면 정확도가 올라갑니다

다음 단계

검색 테스트 — LLM 없이 순수 검색 결과를 확인하여 Knowledge 품질을 검증
청킹 및 옵션 — 청킹 전략과 임베딩 모델이 검색 품질에 미치는 영향 이해
Settings — Knowledge 저장소 타겟 및 임베딩 모델 관리

화면 구조​

왼쪽 패널 — 대화 세션 목록​

중앙 영역 — 채팅 메시지​

하단 설정 바 — RAG 전략 / Wrapper Retriever / 모델​

오른쪽 패널 — 소스 필터​

RAG 전략​

Wrapper Retriever (쿼리 확장 보강)​

모델 선택​

소스 필터링​

동작 방식​

활용 시나리오​

인용 (Citation)​

인용 표시 형식​

출처 확인​

인용 활용​

대화 관리​

세션 저장 방식​

세션 자동 타이틀링​

세션 수 제한​

응답 액션​

효과적인 질문 작성 요령​

다음 단계​