Python 코드 가이드
D.Hub 파이프라인의 Python 코드 노드를 사용하여 데이터를 변환하거나 분석 로직을 수행할 수 있습니다.
기본 구조
Python 코드 노드는 Polars DataFrame을 기반으로 동작합니다.
입력 (Input)
- 연결된 이전 노드의 데이터는
Polars DataFrame형태로 전달됩니다. - 입력 변수명은 사용자가 설정한 **입력 별칭(Input Alias)**을 따릅니다.
옵션 (Options)
- 파이프라인 설정에서 정의한
options딕셔너리를 통해 런타임 변수를 전달받을 수 있습니다.
출력 (Output)
- 반드시
output이라는 키를 가진 딕셔너리를 반환해야 합니다. output의 값은Polars DataFrame이어야 합니다.
예제 코드
import polars as pl
def transform(inputs, options):
# 1. 입력 데이터 가져오기 (입력 별칭이 'input_df'인 경우)
df = inputs['input_df']
# 2. 데이터 변환 로직 (예: 'count' 컬럼에 2를 곱함)
result_df = df.with_columns(
(pl.col("count") * 2).alias("doubled_count")
)
# 3. 결과 반환
return {
"output": result_df
}
사용 가능한 패키지
기본적으로 다음 패키지들이 환경에 포함되어 있습니다. 추가 패키지는 노드 설정에서 지정할 수 있습니다.
polarspandasnumpy