본문으로 건너뛰기
버전: Next

Python 코드 가이드

D.Hub 파이프라인의 Python 코드 노드를 사용하여 데이터를 변환하거나 분석 로직을 수행할 수 있습니다. Polars DataFrame을 기본으로 동작합니다.

실행 계약

코드 노드는 run 함수를 진입점으로 사용합니다.

import polars as pl

def run(input, options):
# input : Polars DataFrame (입력 데이터)
# options: dict (런타임 옵션)
output = input.with_columns(
(pl.col("count") * 2).alias("doubled_count")
)
return {"output": output}

입력 (input)

  • 단일 입력은 첫 번째 매개변수 input(Polars DataFrame)으로 전달됩니다.
  • 입력이 여러 개인 노드는 각 입력 연결의 별칭(alias)을 매개변수 이름으로 받습니다(예: def run(orders, customers, options)). 마지막 매개변수는 항상 options입니다.

옵션 (options)

  • 파이프라인 설정에서 정의한 런타임 변수가 options 딕셔너리로 전달됩니다.

출력 (output)

  • 반드시 "output" 키를 가진 딕셔너리를 반환해야 하며, 값은 Polars DataFrame입니다.
  • return output처럼 DataFrame을 직접 반환하면 오류가 발생합니다.

사용 가능한 패키지

기본 환경에 다음 패키지가 포함되어 있습니다. 더 자세한 예시(집계·조인·GIS·Pandas 호환)는 개발자 가이드 — Python 가이드를 참고하세요.

  • polars (기본 데이터 처리 라이브러리)
  • pandas
  • numpy

추가 패키지가 필요하면 파이프라인/코드 설정에서 조정하거나 관리자에게 문의하세요.