Architecture & Technology
D.Hub 플랫폼을 구성하는 논리적 서비스 구조와, 파이프라인·Knowledge 코드를 작성할 때 알아두면 좋은 기술 스택을 정리합니다. 이 페이지는 개발자를 위한 개념 레퍼런스입니다.
서비스 아키텍처
D.Hub는 세 개의 독립적인 백엔드 서비스와 하나의 프론트엔드로 구성되며, 각 백엔드는 목적에 맞는 데이터 계층과 연결됩니다.
서비스별 역할
| 서비스 | 역할 | 주요 기능 |
|---|---|---|
| dhub2-manager | 코어 API 서버 | Collection, Dataset, Pipeline, Ontology, Dashboard, Auth, Admin API |
| dhub2-knowledge (Knowledge Builder) | RAG 서버 | 문서 수집, 청킹, 임베딩, 멀티 스토리지 검색, OpenAI 호환 Chat Completions API |
| dhub2-agent | AI 에이전트 서버 | 대화형 어시스턴트, 도구·액터 호출, 데이터 탐색 |
| dhub2-portal | 프론트엔드 | 웹 UI |
데이터 흐름
서비스 간 상호작용을 개념 수준에서 보여줍니다. 구체적인 인프라 컴포넌트는 추상화된 역할명으로 표기합니다.
파이프라인 실행 흐름
Knowledge RAG 흐름
개발자용 기술 스택
파이프라인 Python 코드에서 직접 다루는 데이터 처리 라이브러리입니다. 데이터셋 입출력은 이 라이브러리들의 DataFrame을 기준으로 동작합니다.
| 기술 | 역할 | D.Hub에서의 용도 | 공식 문서 |
|---|---|---|---|
| Polars | 고성능 DataFrame 라이브러리 | 파이프라인 Python 코드의 기본 데이터 처리 엔진 | docs.pola.rs |
| Apache Arrow | 컬럼형 메모리 포맷 | 데이터셋 스키마 타입 시스템, 데이터 전송 | arrow.apache.org/docs |
| Pandas | DataFrame 라이브러리 | 파이프라인 Python 코드에서 선택적 사용 | pandas.pydata.org/docs |
인증은 토큰 기반(JWT)으로 동작합니다. 자세한 발급·검증 흐름은 API 인증을 참고하세요.
다음 단계
- Python 가이드 -- 파이프라인 Python 코드 작성법
- SQL 가이드 -- SQL 문법과 함수
- API 인증 -- REST API 인증 흐름