본문으로 건너뛰기

Python 코드 가이드

D.Hub 파이프라인의 Python 코드 노드를 사용하여 데이터를 변환하거나 분석 로직을 수행할 수 있습니다.

기본 구조

Python 코드 노드는 Polars DataFrame을 기반으로 동작합니다.

입력 (Input)

  • 연결된 이전 노드의 데이터는 Polars DataFrame 형태로 전달됩니다.
  • 입력 변수명은 사용자가 설정한 **입력 별칭(Input Alias)**을 따릅니다.

옵션 (Options)

  • 파이프라인 설정에서 정의한 options 딕셔너리를 통해 런타임 변수를 전달받을 수 있습니다.

출력 (Output)

  • 반드시 output이라는 키를 가진 딕셔너리를 반환해야 합니다.
  • output의 값은 Polars DataFrame이어야 합니다.

예제 코드

import polars as pl

def transform(inputs, options):
# 1. 입력 데이터 가져오기 (입력 별칭이 'input_df'인 경우)
df = inputs['input_df']

# 2. 데이터 변환 로직 (예: 'count' 컬럼에 2를 곱함)
result_df = df.with_columns(
(pl.col("count") * 2).alias("doubled_count")
)

# 3. 결과 반환
return {
"output": result_df
}

사용 가능한 패키지

기본적으로 다음 패키지들이 환경에 포함되어 있습니다. 추가 패키지는 노드 설정에서 지정할 수 있습니다.

  • polars
  • pandas
  • numpy