버전: Next

FDE 시작 (리소스 구성 흐름 가이드)

이 가이드는 D.Hub2 플랫폼을 활용하여 고객사 비즈니스 현장에서 맞춤형 솔루션을 설계하고 데이터 수집부터 온톨로지, 파이프라인, AI 에이전트, 대시보드 시각화까지 주요 리소스를 유기적으로 구성하는 FDE(Forward Deployed Engineer) 및 개발팀을 위한 온보딩 종합 가이드입니다.

포털 상의 비주얼 인터페이스와 실제 스크린샷 흐름에 따라 순서대로 리소스를 조립해 나갈 수 있습니다.

1. 컬렉션 관리 (Collection Management) 상세 보기

컬렉션은 D.Hub2 플랫폼에서 자원을 격리하고 논리적인 작업 공간을 구분하는 가장 기본적이고 필수적인 워크스페이스입니다.

① 나의 컬렉션 확인 및 생성

사이드바의 작업공간 ➔ 컬렉션 탐색기로 진입하면 내가 보유한 모든 컬렉션 목록을 한눈에 조회할 수 있으며, 우측 상단의 컬렉션 만들기 버튼을 클릭하여 새 컬렉션 추가 절차를 시작할 수 있습니다.

나의 컬렉션 목록

② 컬렉션 메타데이터 입력

컬렉션 생성 창에서는 고유 이름, 표시용 별칭(Alias), 설명, 태그를 함께 입력하여 컬렉션 메타데이터를 구성할 수 있습니다. 또한 각 입력 영역 옆의 별 모양 AI 자동완성 버튼을 활용하면, 이미 작성한 이름이나 설명 등의 내용을 바탕으로 별칭, 설명, 태그를 보조 생성하는 방식으로 빠르게 초안을 채울 수 있습니다.

컬렉션 만들기

③ 컬렉션 리소스 항목 추가

컬렉션 목록 트리 상단이나 우클릭 메뉴의 항목 추가 버튼을 누르면 해당 컬렉션 스코프 내부에 귀속될 데이터셋, 코드, 지식(Knowledge), 파이프라인 등 핵심 리소스들을 생성 및 추가할 수 있습니다.

항목 추가 드롭다운

④ 컬렉션 소속 리소스 확인

생성된 컬렉션을 선택하거나 펼쳐보면 해당 컬렉션에 소속되어 격리 관리되고 있는 하위 리소스들의 유형과 배치 상태를 즉각 파악할 수 있습니다.

컬렉션 소속 리소스 조회

2. 온톨로지 모델링 (Ontology Modeling) 상세 보기

다차원 로데이터를 유기적으로 연결하여 지식 그래프(Knowledge Graph)의 의미망을 설계합니다.

⑤ 온톨로지 목록 확인

사이드바 온톨로지 그룹의 모델링 메뉴를 클릭하여 기 정의된 온톨로지 리스트와 각각의 매핑 컬렉션을 확인합니다.

온톨로지 목록

⑥ 온톨로지 빌더 진입 (컬렉션 지정 필수)

신규 온톨로지 모델링을 진행하기 위해 우측 상단에서 대상이 될 컬렉션을 필수적으로 지정한 다음, 빌더 열기 버튼을 누릅니다.

온톨로지 빌더 진입

⑦ 온톨로지 빌더 화면

비주얼 그래프 설계 환경인 온톨로지 빌더가 실행됩니다. 여기서 엔티티와 관계 노드를 생성하고 에지를 드래그하여 연결할 수 있습니다.

온톨로지 빌더

⑧ 엔티티 및 관계 생성

빌더 좌측 목록 패널 및 상단 제어 바를 사용하여 온톨로지의 뼈대가 될 엔티티(Entity)와 엔티티들을 잇는 관계(Relationship) 구조를 정의할 수 있고, 이러한 정의는 캔버스 상에 렌더링 됩니다.

엔티티 및 관계 리스트

⑨ 엔티티 기본 정보 기입

추가된 엔티티의 기본 정보인 이름, 렌더링 별칭, 설명, 태그를 입력합니다.

엔티티 정보 입력

⑩ 식별 키(Identity Keys) 지정 및 속성 정의

데이터의 고유 식별성을 확보하고 중복 적재를 방지하기 위해 식별 키(Identity Keys)를 설정합니다. 비즈니스 요구사항에 따라 여러 속성을 묶어서 복합키(Composite Key) 형태로 설정할 수 있습니다. 또한, 엔티티가 포함할 각 속성의 데이터 타입 및 설명 필드를 세부 정의합니다.

엔티티 속성 상세

⚠️ D.Hub2 이중 스토리지 저장 설계

엔티티 & 관계 (Ontology): 온톨로지 엔티티/관계 데이터는 트랜잭션 일관성과 무결성을 보장하기 위해 PostgreSQL의 ontology 데이터베이스 내 컬렉션별 스키마 테이블에 먼저 적재되며, 데이터 신뢰의 원천(Source of Truth)이 됩니다. 이후 CDC 기반 동기화 경로를 통해 Delta Lake/ClickHouse 분석 테이블과 Neo4j 그래프 조회 경로가 함께 갱신됩니다.
원천 데이터셋 (Datasets): 원천 데이터셋은 ACID 트랜잭션과 대용량 가공을 위해 Delta Lake (S3/MinIO 기반 오브젝트 스토리지)에 테이블 형식으로 영구 저장되며, 조회 및 분석을 위해 ClickHouse DeltaLake 엔진 테이블로 등록됩니다.

3. 데이터 파이프라인 구축 및 가공 (Pipeline Ingestion) 상세 보기

원시 데이터를 변환하여 데이터셋과 온톨로지 그래프 상에 밀어 넣는 ETL 파이프라인을 구축합니다.

⑪ 파이프라인 목록 확인

컬렉션 탐색기 또는 전용 리스트 페이지에서 등록된 전체 파이프라인의 목록과 최종 수정 정보를 검토합니다.

파이프라인 리스트

⑫ 파이프라인 생성 (컬렉션 매핑)

신규 파이프라인을 추가할 때에도 해당 작업의 권한과 스코프 격리를 위해 대상이 될 컬렉션을 명시하여 매핑해 주어야 합니다.

파이프라인 생성 다이얼로그

⑬ 파이프라인 빌더 및 리소스 재사용

파이프라인 빌더가 오픈됩니다. 좌측 사이드바를 통해 신규 데이터셋, 코드를 즉석에서 생성하여 추가할 수 있으며, 이전에 이미 빌딩해 둔 데이터셋, 코드 파일, 엔티티 리소스 등을 검색 탭에서 선택해 캔버스로 바로 배치하여 연동할 수 있습니다.

파이프라인 빌더 리소스 선택

⑭ 완성된 파이프라인 플로우

각 노드들이 유기적으로 배치되어 정상적인 흐름으로 연결이 완료된 실제 파이프라인 구성 화면입니다.

완성된 파이프라인 플로우

⑮ 파이프라인 실행

상단 메뉴바의 실행(Run) 아이콘 버튼을 통해 적재 작업을 구동하여 대용량 배치 프로세스 및 변환 연산을 기동합니다.

파이프라인 실행

⑯ 데이터셋 적재 결과 검증

실행이 성공하면 대상 컬렉션 내부의 데이터셋(Dataset) 화면으로 넘어가 실제로 데이터가 Delta Lake 포맷 테이블 구조에 정합하게 로드되었는지 확인합니다.

데이터셋 적재 확인

⑰ 엔티티 적재 결과 검증

마찬가지로 온톨로지의 엔티티(Entity) 항목을 더블클릭하여 그래프 인스턴스 데이터가 안정적으로 쓰였는지 확인합니다. D.Hub2의 엔티티는 실시간 트랜잭션을 위한 PostgreSQL 테이블을 기반으로 작동하며, 고속 뷰 조회를 위해 ClickHouse 상의 배후 데이터셋 (Backing Dataset)과 미러링 연동됩니다.

엔티티 적재 확인

⑱ 파이프라인 배치 스케줄러 설정

파이프라인 상세 설정 내 배치 설정 탭에서 크론(Cron) 주기 혹은 시간 간격을 지정하여 주기적으로 데이터 정화 및 자동 적재를 반복하도록 스케줄링할 수 있습니다.

배치 일정 설정

4. 대시보드 시각화 (Dashboard) 상세 보기

⑲ 대시보드 렌더링

파이프라인을 통해 정합하게 적재된 델타 레이크 데이터셋과 PostgreSQL 온톨로지 엔티티 데이터를 자유롭게 활용하여 실시간 관제 및 분석용 대시보드를 구축할 수 있습니다.

위젯 에디터에서 데이터 소스를 매핑하고 데이터를 집계한 후, 지도(Map) 위젯, 산점도(Scatter) 차트, 일반 막대/선형 차트, 표(Table), 그리고 커스텀 텍스트 및 외부 사이트 임베드 위젯을 그리드 레이아웃 상에 유기적으로 배치하여 의사결정용 시각화 대시보드를 완성합니다.

완성된 대시보드 화면

5. LLM 모델 관리 (LLM Model Configuration) 상세 보기

에이전트에 주입해 사용할 LLM API 정보와 서빙 규격을 공통 카탈로그로 통합 관리합니다.

⑳ 모델 관리 리스트 및 추가

설정 ➔ LLM 모델 메뉴에서 현재 사용 가능한 모델 목록을 파악하고, 우측 상단 모델 등록 버튼을 누릅니다.

모델 등록 페이지

㉑ 모델 기본 정보 입력 (배치 유형 결정)

이름, 포털 표시용 별칭, 매핑될 격리 컬렉션, 설명을 입력합니다.

외부(External): 이미 운영 중인 외부 또는 자체 호스팅 LLM 엔드포인트를 Base URL 기준으로 등록할 때 선택합니다.
내부(Internal): D.Hub2가 Kubernetes 상에 모델 런타임을 직접 배포하고 관리할 때 선택합니다. 이 경우 이미지, 포트, 리소스, 환경변수 등 배포 설정을 함께 등록합니다.
주의: 배치(Batch/Deployment) 방식 유형은 등록 완료 후 변경이 불가능합니다.

모델 기본 정보

㉒ 제공자 및 모델 식별자 설정

제공자(Provider) 목록에서 현재 플랫폼에 등록된 제공자(예: OpenAI 계열, Claude 계열)를 선택한 뒤, 실제 API로 전송할 고유 모델명 ID를 작성합니다 (예: claude-opus-4-7, gpt-oss-120b).
제공자 및 모델 ID 설정

㉓ 엔드포인트 및 API Key 바인딩

외부(External) 모델의 경우, 해당 모델 API가 전송될 서버 엔드포인트(Base URL)를 지정하고 실제 통신 시 헤더에 실릴 API Key 비밀값(Access Token)을 기입한 후 저장합니다.
내부(Internal) 모델의 경우에는 사용자가 Base URL을 직접 입력하는 것이 아니라, 등록한 배포 설정을 바탕으로 플랫폼이 내부 서비스 엔드포인트를 구성합니다.

엔드포인트 및 API Key 기입

6. AI 에이전트 구축 (AI Agent Builder) 상세 보기

사용자의 프롬프트 요구와 등록된 도구(Tools)를 결합하여 추론 행동을 수행하는 에이전트를 조립합니다.

㉔ 에이전트 관리 페이지

사이드바의 에이전트 메뉴로 들어가 기존에 배포되었거나 편집 중인 에이전트들을 모니터링하고 + 에이전트 만들기를 진행합니다.

에이전트 목록

㉕ 에이전트 기본 정보 기입

에이전트의 명칭, 한국어 별칭, 그리고 에이전트가 귀속될 타겟 컬렉션 ID를 매핑합니다.
(컬렉션 선택 필수)

에이전트 기본 정보

㉖ 에이전트 동작 모드 결정 (AI 에이전트 vs 워크플로우)

에이전트의 구동 형태를 2가지 중 하나로 고정하여 생성합니다.

AI 에이전트 모드: 사용자와 질의응답을 주고받을 수 있는 채팅 기반 인터페이스입니다. LLM이 스스로 판단하여 툴을 실행하는 ReAct 추론 모드입니다.
워크플로우 모드: 채팅 화면을 타지 않고 정해진 그래프 분기와 순서에 따라 작업을 실행하는 비대화형 흐름 모드입니다.

에이전트 모드 선택

㉗ 시스템 지침(Prompt) 및 모델 할당

에이전트 상세 빌더(에이전트 상세 빌더는 에이전트 목록에서 해당 에이전트를 클릭하면 진입 가능)로 진입해 에이전트가 지켜야 할 가이드라인인 시스템 지침(Prompt)을 입력하고, 모델 항목에서 앞서 등록한 LLM 모델을 찾아 연결(할당)해 줍니다.

지침 및 모델 바인딩

㉘ 가용 툴 바인딩

에이전트가 지침 수행 중에 필요 시 호출하여 작동할 도구(Tools)와 액터(Actors)들을 체크박스 라이브러리 목록에서 바인딩시킵니다.

도구 및 액터 바인딩

7. 도구(Tool) 및 액터(Actor) 개발 상세 보기

에이전트의 추론 기능적 한계를 돌파하기 위해 PostgreSQL 조회, 웹 연동 등 커스텀 작동 단위를 개발합니다.

㉙ 도구 목록 관리

사이드바 도구 그룹 아래의 도구 메뉴로 진입해 에이전트가 재사용할 수 있는 커스텀 도구 리스트를 확인하고 추가합니다.

도구 목록

액터(Actor)란?

액터는 도구와 생성 흐름(메타데이터 → 타입 → 파라미터 → 커넥터)이 동일합니다. 차이점은 상태를 변경하는 작업(DB 쓰기, 외부 시스템 호출 등)에 사용된다는 점과, 생성 시 확인 정책(Confirmation Policy) 을 추가로 설정할 수 있다는 점입니다.

auto: 에이전트가 즉시 실행
confirm: 실행 전 사람의 승인을 대기 (HITL)

사이드바의 에이전트 > 액터 메뉴에서 동일한 방식으로 생성하세요.

㉚ 도구 메타데이터 기입

도구의 기본 고유 영문 이름, 화면 렌더링용 별칭, 동작 목적을 서술하는 설명을 채워 넣습니다.

도구 기본 정보

㉛ 도구 실행 타입 설정 및 실행 대상 연결

도구 생성 시 타입(Type)을 결정하고, 타입에 따라 소스 코드를 작성하거나 호출 대상을 연결합니다. 현재 포털 생성 화면에서는 주로 다음 두 가지 흐름을 사용합니다:

Python: 사용자가 직접 작성한 Python 함수 코드를 실행하는 방식입니다. DB 조회 쿼리문 실행이나 외부 API 호출 등 커스텀 코드가 작동하도록 구성할 때 사용합니다.
Agent: 다른 하위 에이전트를 도구로 연결하여 호출하는 방식입니다. 특정 역할에 특화된 에이전트에게 협업 및 추론 작업을 위임하는 멀티 에이전트(Multi-agent) 협업 관계를 구성할 수 있습니다.

도구 코드 에디터

㉜ 입력 파라미터 및 커넥터 연동

특히 Python 도구의 경우, LLM이 프롬프트를 인식해 인자값을 넘길 수 있도록 입력 파라미터 규약(JSON Schema)을 자세히 작성합니다. (예: keyword 속성을 정의하여 문자열 검색 인자 전송).
또한 코드 내부에서 의존하여 접속할 데이터 연결(Connector) 정보를 바인딩해, PostgreSQL 조회나 외부 시스템 연동 로직이 동일한 접속 정의를 재사용하도록 구성합니다.

입력 파라미터 및 커넥터 설정

8. 데이터 연결 (Connector) 구성 상세 보기

㉝ 데이터 연결 목록

Agent Tool과 Pipeline에서 공통으로 재사용할 Data Connection(Connector) 목록을 조회합니다.

데이터 연결 목록

㉞ 커스텀 커넥터 유형 및 템플릿 설정

커넥터 생성 화면에서는 먼저 커넥터 타입(DB, Graph, REST, S3 등)을 고르고, 이어서 내장 템플릿(예: postgres, datahub, neo4j) 또는 커스텀 스크립트 방식을 선택합니다.
일부 타입은 구조화된 옵션 폼으로 설정하고, 커스텀 커넥터의 경우에는 제공되는 스크립트 템플릿을 기반으로 연결 로직을 확장할 수 있습니다.

커스텀 커넥터 생성

9. 지식 베이스 및 RAG 연동 (Knowledge Base) 상세 보기

에이전트가 내부 보안 문서나 비정형 자료집을 참조하여 답변할 수 있게 검색 데이터베이스를 구축합니다.

㉟ 지식 관리 리스트

RAG 기능을 처리하기 위해 생성되어 있는 지식 베이스 목록을 확인하고, 신규 지식을 생성합니다.

지식 관리 페이지

㊱ 지식 기본 정보 설정

지식의 한글 별칭, 격리 스코프 지정을 위한 대상 컬렉션, 설명을 작성합니다.

지식 기본 정보

㊲ RAG 검색 옵션 설정

사용자가 에이전트와 대화 시 문서를 어떤 방식으로 색인하고 검색할지 선택합니다:

시맨틱 검색 (Semantic Search): 자연어 질문과 유사한 맥락을 갖는 임베딩 기반 의미 검색
키워드 검색 (Keyword Search): 특정 단어가 매칭되는 횟수와 정확성을 따지는 전통적 텍스트 검색
하이브리드 검색 (Hybrid Search): 시맨틱 검색과 키워드 검색을 함께 활용하는 혼합형 검색

RAG 검색 옵션

㊳ 문서 추가 및 청킹 설정

지식 생성 완료 후 문서 추가 기능을 통해 세 가지 방식으로 비정형 소스를 공급합니다:

수동 문서: 텍스트 내용 복사 붙여넣기 기입
웹 크롤링: 특정 크롤링 대상 URL 링크 지정
파일 업로드: 사내 매뉴얼, PDF 파일 직접 업로드

청킹(Chunking) 설정: 특히 웹 크롤링이나 파일 인덱싱 과정에서 문서를 어떻게 분할할지 전략을 설정할 수 있습니다. 기본적인 청크 크기(Chunk Size)와 중복 크기(Overlap)뿐 아니라, 전략에 따라 semantic/agentic 등 세부 옵션이 함께 적용될 수 있습니다. 이후 이 지식 베이스는 에이전트의 검색 컨텍스트로 활용되어 RAG 서비스를 수행합니다.

지식 문서 추가 및 청킹

10. 에이전트 배포 및 테스트 (Deployment & Chat Verification) 상세 보기

㊴ 에이전트 배포(Deploy)

도구, 지식, 프롬프트 등 에이전트 설정을 모두 완수했다면, 변경 사항을 Live 런타임 환경에 띄우기 위해 에이전트 상세 화면이나 목록의 배포(Deploy) 버튼을 누릅니다.

에이전트 배포

㊵ 배포 상태 확인 및 액션 목록

배포 정상 완료되면 상태 아이콘이 녹색의 실행 중 상태 배지로 바뀝니다. 우측의 관리 도구 모음 아이콘을 누르면 기 편집, 배포 중지(Undeploy), 채팅 테스트, 삭제 기능을 제어할 수 있습니다.

배포 상태 목록

㊶ 대화형 채팅 테스트 검증

목록에서 채팅 테스트 아이콘을 클릭하여 사이드 테스트 패널 혹은 전용 채팅방으로 진입한 뒤, 에이전트와 직접 자연어 질문을 나눠 RAG(지식 답변)와 바인딩된 도구(PostgreSQL 쿼리 등)가 정상 작동하는지 대화하며 최종적으로 솔루션 가동 여부를 검증합니다.

에이전트 채팅 테스트

마무리

본 문서는 전체 구성 흐름을 빠르게 따라가기 위한 시작 가이드입니다. 각 기능의 세부 설정값, 운영 방식, 고급 활용 방법은 컬렉션, 데이터셋, 파이프라인, 온톨로지, 모델 관리, 지식 관리, 에이전트, 도구, 커넥터 등 개별 항목 문서를 함께 참고하시기 바랍니다.

1. 컬렉션 관리 (Collection Management) 상세 보기​

① 나의 컬렉션 확인 및 생성​

② 컬렉션 메타데이터 입력​

③ 컬렉션 리소스 항목 추가​

④ 컬렉션 소속 리소스 확인​

2. 온톨로지 모델링 (Ontology Modeling) 상세 보기​

⑤ 온톨로지 목록 확인​

⑥ 온톨로지 빌더 진입 (컬렉션 지정 필수)​

⑦ 온톨로지 빌더 화면​

⑧ 엔티티 및 관계 생성​

⑨ 엔티티 기본 정보 기입​

⑩ 식별 키(Identity Keys) 지정 및 속성 정의​

3. 데이터 파이프라인 구축 및 가공 (Pipeline Ingestion) 상세 보기​

⑪ 파이프라인 목록 확인​

⑫ 파이프라인 생성 (컬렉션 매핑)​

⑬ 파이프라인 빌더 및 리소스 재사용​

⑭ 완성된 파이프라인 플로우​

⑮ 파이프라인 실행​

⑯ 데이터셋 적재 결과 검증​

⑰ 엔티티 적재 결과 검증​

⑱ 파이프라인 배치 스케줄러 설정​

4. 대시보드 시각화 (Dashboard) 상세 보기​

⑲ 대시보드 렌더링​

5. LLM 모델 관리 (LLM Model Configuration) 상세 보기​

⑳ 모델 관리 리스트 및 추가​

㉑ 모델 기본 정보 입력 (배치 유형 결정)​

㉒ 제공자 및 모델 식별자 설정​

㉓ 엔드포인트 및 API Key 바인딩​

6. AI 에이전트 구축 (AI Agent Builder) 상세 보기​

㉔ 에이전트 관리 페이지​

㉕ 에이전트 기본 정보 기입​

㉖ 에이전트 동작 모드 결정 (AI 에이전트 vs 워크플로우)​

㉗ 시스템 지침(Prompt) 및 모델 할당​

㉘ 가용 툴 바인딩​

7. 도구(Tool) 및 액터(Actor) 개발 상세 보기​

㉙ 도구 목록 관리​

㉚ 도구 메타데이터 기입​

㉛ 도구 실행 타입 설정 및 실행 대상 연결​

㉜ 입력 파라미터 및 커넥터 연동​

8. 데이터 연결 (Connector) 구성 상세 보기​

㉝ 데이터 연결 목록​

㉞ 커스텀 커넥터 유형 및 템플릿 설정​

9. 지식 베이스 및 RAG 연동 (Knowledge Base) 상세 보기​

㉟ 지식 관리 리스트​

㊱ 지식 기본 정보 설정​

㊲ RAG 검색 옵션 설정​

㊳ 문서 추가 및 청킹 설정​

10. 에이전트 배포 및 테스트 (Deployment & Chat Verification) 상세 보기​

㊴ 에이전트 배포(Deploy)​

㊵ 배포 상태 확인 및 액션 목록​

㊶ 대화형 채팅 테스트 검증​

마무리​