Python 코드 가이드
D.Hub 파이프라인의 Python 코드 노드를 사용하여 데이터를 변환하거나 분석 로직을 수행할 수 있습니다. Polars DataFrame을 기본으로 동작합니다.
실행 계약
코드 노드는 run 함수를 진입점으로 사용합니다.
import polars as pl
def run(input, options):
# input : Polars DataFrame (입력 데이터)
# options: dict (런타임 옵션)
output = input.with_columns(
(pl.col("count") * 2).alias("doubled_count")
)
return {"output": output}
입력 (input)
- 단일 입력은 첫 번째 매개변수
input(Polars DataFrame)으로 전달됩니다. - 입력이 여러 개인 노드는 각 입력 연결의 별칭(alias)을 매개변수 이름으로 받습니다(예:
def run(orders, customers, options)). 마지막 매개변수는 항상options입니다.
옵션 (options)
- 파이프라인 설정에서 정의한 런타임 변수가
options딕셔너리로 전달됩니다.
출력 (output)
- 반드시
"output"키를 가진 딕셔너리를 반환해야 하며, 값은 Polars DataFrame입니다. return output처럼 DataFrame을 직접 반환하면 오류가 발생합니다.
사용 가능한 패키지
기본 환경에 다음 패키지가 포함되어 있습니다. 더 자세한 예시(집계·조인·GIS·Pandas 호환)는 개발자 가이드 — Python 가이드를 참고하세요.
polars(기본 데이터 처리 라이브러리)pandasnumpy
추가 패키지가 필요하면 파이프라인/코드 설정에서 조정하거나 관리자에게 문의하세요.