본문으로 건너뛰기
버전: v0.1.0

데이터셋 생성

템플릿 마법사를 사용하여 새 데이터셋을 생성하는 방법을 설명합니다.

1단계: 유형 선택 (Select Type)

  1. Dataset 카드를 선택합니다.
  2. 하위 유형(Subtype, type)을 선택합니다 — 데이터셋 모델의 Literal 4종.
    • delta: Delta Lake 테이블 (기본 사용 케이스)
    • kafka: 실시간 메시지 스트림
    • rest: 외부 REST 엔드포인트
    • object: 파일/객체 스토리지

컬렉션 트리 또는 컬렉션 헤더의 + 항목 추가 ▾ → 데이터셋을 통해 위자드에 진입하면, 위 컨텍스트가 자동으로 잠긴 상태로 시작됩니다.

2단계: 기본 정보 (Basic Info)

[Screenshot] 데이터셋 생성 마법사의 기본 정보 입력 화면

데이터셋의 메타데이터를 정의합니다.

  • Name: 데이터셋 이름 (필수)
  • Alias: 표시 이름
  • Description: 데이터셋 설명
  • Tags: 검색 태그
  • 추가 설정 (유형별):
    • REST: API Endpoint URL 입력 (필수)
    • Kafka/DDS: Topic 이름 입력 (AI 자동 생성 가능)

3단계: 스키마 정의 (Schema)

데이터셋의 구조(컬럼)를 정의합니다. 세 가지 모드를 지원합니다.

CSV/JSON 업로드로 빠르게 스키마 추론

이미 가진 CSV/JSON 파일로 데이터셋을 만들 때는 Quick Upload 흐름이 더 빠릅니다. 헤더 편집 가능한 미리보기와 AI 컬럼 명명 기능이 함께 제공됩니다 — 데이터셋 — Quick Upload 참고.

UI 모드

[Screenshot] 데이터셋 스키마 정의 화면 (UI 모드에서 컬럼 추가된 상태)

직관적인 테이블 인터페이스에서 컬럼을 추가하고 설정합니다.

  • Add Column: 새 컬럼 추가
  • Name: 컬럼명
  • Type: 데이터 타입 (Text, Integer, Decimal, Boolean, Timestamp, Date 등)
  • Nullable: Null 값 허용 여부

JSON 모드

JSON 형식으로 스키마를 직접 작성하거나 붙여넣을 수 있습니다. 복잡한 중첩 구조 정의에 유리합니다.

CSV 모드

샘플 CSV 파일을 업로드하여 스키마를 자동으로 추론합니다.

  • 파일을 드래그 앤 드롭하거나 선택하여 업로드하면, 헤더와 데이터 타입을 분석하여 스키마를 자동 생성합니다.

완료

모든 설정이 끝나면 Create (또는 Submit Dataset) 버튼을 눌러 데이터셋을 생성합니다.