데이터 엔지니어로 5분 만에 시작하기
데이터를 표가 아닌 엔티티와 관계의 그래프로 다루는 엔지니어를 위한 5분 on-ramp입니다. 이미 import된 covid19 데이터셋 위에 안심병원(Clinic) 엔티티 1개를 정의하고, 그래프 탐색기에서 즉시 확인합니다.
사전 준비
- D.Hub 계정 (관리자에게 발급받은 로그인 ID·비밀번호 또는 SSO)
- covid19 예제의 Step 1~3을 먼저 끝내 컬렉션
노원구 COVID-19 분석에 9개 데이터셋이 있어야 합니다.
5분에 얻을 결과
Clinic엔티티 1개 정의 — 속성 5개 + 식별 키 + 표시 컬럼 포함- backing dataset 매핑 (clinics 데이터셋) — sink가 자동으로 그래프 DB로 적재
- 그래프 탐색기에서
Clinic라벨에 노드 20개가 적재되었음을 확인
Quick path (5분)
스크린샷 TODO
온톨로지 빌더에서 Clinic 엔티티 카드가 캔버스에 있고, 우측 인스펙터에 식별 키, 표시 컬럼, 데이터(데이터셋) 매핑이 채워진 상태를 보여주세요.
- 좌측 사이드바에서 모델링을 클릭한 뒤
노원구 COVID-19 분석컬렉션의 모델링 항목을 선택합니다. 온톨로지 빌더(Ontology Builder) 캔버스가 열립니다. (1분) - 캔버스 상단의 엔티티 추가 버튼을 클릭합니다. 우측 인스펙터에서 다음을 설정합니다.
- 이름:
Clinic(개요 탭) - 속성:
clinic_id (Text),clinic_name (Text),clinic_type (Text),latitude (Decimal),longitude (Decimal)(속성 탭) - 식별 키:
clinic_id - 표시 컬럼:
clinic_name(2분)
- 이름:
- 인스펙터의 데이터 탭을 엽니다. 데이터셋으로
clinics를 선택하면 동일 이름 컬럼들이 자동 매핑됩니다. 식별 키clinic_id가 자동 인식되었는지 확인합니다. (1분) - 사이드바에서 그래프 탐색기로 이동합니다. 좌측 메타데이터 패널의 엔티티 목록에서
Clinic 20이 보일 때까지 30초~1분 기다린 뒤 라벨을 클릭하면 노드 20개가 시각화 영역에 펼쳐집니다. (1분)
여기까지 완료하면
- 빌더 캔버스에
Clinic엔티티 카드 1개가 보이고, 인스펙터의 속성 탭에 식별 키·표시 컬럼이, 데이터 탭에 데이터셋 매핑이 채워져 있습니다. - 그래프 탐색기 메타데이터 패널에
Clinic라벨 옆 카운트가20으로 표시됩니다. - 라벨이 보이지 않으면 sink가 아직 진행 중일 수 있습니다 — 1분 더 기다린 뒤 새로고침.
끝났다면?
| Lv | 다음 단계 | 가이드 |
|---|---|---|
| Lv1 | covid19 온톨로지 전체 따라하기 (20분) — Patient·Region 추가 + 관계 정의 + 지도 시각화 | covid19-ontology 예제 |
| Lv2 | 파이프라인 워크플로우 편집기 — 노드 기반 데이터 흐름 설계 | Workflow Editor |
| Lv3 | 같은 흐름을 API/cURL로 자동화 | 개발자 가이드 - API 튜토리얼 |
핵심 자료
전체 학습 경로는 역할별 가이드를 참고하세요.