본문으로 건너뛰기
버전: v0.2.0

데이터셋 생성

템플릿 마법사를 사용하여 새 데이터셋을 생성하는 방법을 설명합니다.

위자드 시작 — 하위 유형 선택

데이터셋의 하위 유형(subtype) 은 위자드를 열기 전, 컬렉션 항목 추가 ▾ → 데이터셋 메뉴의 하위 메뉴에서 선택합니다. 선택한 유형과 진입한 컬렉션·폴더 컨텍스트는 위자드에 잠긴 상태로 전달되며, 위자드는 곧바로 기본 정보 단계부터 시작합니다(위자드 안에 별도의 유형 선택 단계는 없습니다).

하위 유형 (type)설명
delta버전 이력과 ACID를 지원하는 Delta Lake 테이블 (기본 사용 케이스)
kafka토픽 기반의 실시간 메시지 스트림
restHTTP REST API 엔드포인트 연결
objectS3 호환 비정형 파일·바이너리 저장소

1단계: 기본 정보

데이터셋의 메타데이터를 정의합니다.

  • 이름 (Name): 필수. 소문자로 시작하고 소문자·숫자·밑줄(_)만 사용하며 최대 128자입니다.
  • 별칭 (Alias) · 설명 (Description) · 태그 (Tags): 선택. 각 입력란 옆 AI 생성 버튼으로 자동 제안을 받을 수 있습니다.
  • 컬렉션 (Collection): 컬렉션 컨텍스트 없이 진입한 경우 대상 컬렉션을 선택합니다(메뉴로 진입하면 자동 지정).
  • 유형별 추가 입력:
    • REST: URL(필수). URL 추가로 여러 엔드포인트를 등록할 수 있습니다.
    • Kafka: 토픽(선택). AI 생성 버튼으로 토픽 이름을 자동 제안받을 수 있습니다.
    • Object: 스키마 단계가 없습니다. 안내에 따라 생성 후 상세 페이지에서 파일을 업로드합니다.

2단계: 스키마 정의

데이터셋의 구조(컬럼)를 정의합니다. object를 제외한 데이터셋에 이 단계가 표시되며, 세 가지 모드를 제공합니다.

CSV/JSON 업로드로 빠르게 스키마 추론

이미 가진 CSV/JSON 파일로 데이터셋을 만들 때는 Quick Upload 흐름이 더 빠릅니다. 헤더 편집 가능한 미리보기와 AI 컬럼 명명 기능이 함께 제공됩니다 — 데이터셋 — 파일 업로드 참고.

UI 모드

테이블 인터페이스에서 컬럼을 추가하고 설정합니다.

  • 열 추가: 새 컬럼을 추가합니다.
  • 열 이름 · 별칭 · 설명 · 데이터 타입 · NULL 허용을 지정합니다.
  • 데이터 타입: Text · Smallint · Integer · Bigint · Real · Double · Numeric · Boolean · Date · Time · Timestamp · List · Binary. 네이티브 타입 표시 토글을 켜면 Arrow 네이티브 이름(Date32/Date64 등)으로 전환됩니다.

새 데이터셋은 임시 스키마 field1만 가진 상태로도 생성할 수 있으며, 이후 파일 업로드로 실제 컬럼이 채워집니다.

JSON 모드

스키마를 JSON으로 직접 작성하거나 붙여넣습니다. 복잡한 구조 정의에 유리합니다.

CSV 모드

샘플 CSV 파일을 업로드하면 헤더와 데이터 타입을 분석해 스키마를 자동 추론합니다.

완료

모든 설정이 끝나면 데이터셋 만들기 버튼으로 생성합니다. 임시 스키마(field1) 상태로 진행하면 버튼이 임시 스키마로 생성으로 표시됩니다.