수업 1파생 필드 생성: 롤링 수요(7/30/90일), 리드타임 편차(실제-표준), 단위당 출하량, 출하 단위당 비용이 섹션에서는 공급망 분석을 강화하는 파생 지표 생성을 다룹니다. 롤링 수요 기간, 리드타임 편차, 출하 강도, 출하 단위당 비용을 계산하여 모니터링과 모델링에 활용합니다.
롤링 7/30/90일 수요 계산리드타임 편차 및 변동성 지표주문 라인당 및 단위당 출하량출하 단위당 및 경로당 비용파생 필드 재사용 및 감사 저장수업 2범주형 필드 정규화: supplier_id, transport_mode, warehouse_id; 동의어 매핑 및 분석 인코딩이 섹션에서는 공급자, 운송 모드, 창고 식별자 등의 범주형 필드를 정규화하는 방법을 설명합니다. 동의어를 매핑하고 코드를 표준화하며 모델링과 보고를 위한 카테고리 인코딩을 수행합니다.
공급자 및 창고 ID 표준화transport_mode 및 경로 라벨 정제동의어 및 별칭 매핑 테이블 구축천천히 변화하는 범주형 값 처리ML 및 BI 도구를 위한 카테고리 인코딩수업 3Excel, Python(pandas), R(data.table/readr)에서 대용량 CSV 안정적 읽기: 날짜 및 타입 파싱이 섹션에서는 Excel, Python, R에서 대용량 CSV를 타입이나 날짜 손상 없이 안정적으로 읽는 방법을 보여줍니다. 구분자, 인코딩, 메모리 제한, 청크 로딩, 스키마 정의를 처리하여 반복 가능한 수집을 수행합니다.
구분자, 헤더, 인코딩 구성날짜, 시간, 시간대 올바른 파싱pandas 및 R에서 컬럼 타입 제어청크 및 증분 CSV 로딩Excel 행 제한 및 충돌 대처수업 4시계열 및 단면 필드 이상치 탐지: z-점수, IQR, 롤링 중앙값 필터, 도메인 임계값이 섹션에서는 시계열 및 단면 공급망 데이터에서 이상치를 탐지하고 처리하는 방법을 가르칩니다. z-점수, IQR, 롤링 통계, 도메인 임계값을 적용한 후 값을 상한 처리, 수정 또는 제외합니다.
시계열 이상치 시각 검토z-점수 및 수정 z-점수 접근IQR 울타리 및 견고한 분포 측정롤링 중앙값 및 롤링 MAD 필터도메인 기반 임계값 및 상한 규칙수업 5데이터 일관성 검사: 중복 행, 음수 수량, 불일치 단위/통화, SKU-창고당 날짜 연속성이 섹션에서는 공급망 CSV의 거래 일관성을 검증합니다. 중복 레코드, 음수 또는 불가능한 수량, 단위 및 통화 불일치, SKU–창고 시계열의 간극 또는 중첩을 탐지합니다.
중복 행 탐지 및 해결음수 또는 불가능한 수량 플래그측정 단위 및 변환 검증통화 코드 및 FX 정렬 검사SKU–창고당 날짜 연속성 보장수업 6시간대 및 비즈니스 캘린더 조정: 휴일, 마감, 비즈니스 데이 처리로 리드타임 계산이 섹션에서는 타임스탬프를 비즈니스 캘린더와 정렬하여 리드타임, 서비스 수준, 마감을 비교 가능한 비즈니스 데이에 계산합니다. 주말, 지역 휴일, 창고별 운영 일정을 조정합니다.
시스템 간 시간대 표준화비즈니스 데이 및 휴일 캘린더 구축출하 및 주문 마감 시간 모델링캘린더 데이를 비즈니스 데이로 변환Python에서의 리드타임 계산 예제수업 7컬럼 의미 및 메타데이터 매핑: 날짜, SKU, 창고, 공급자, 수요, 예측, 재고, 출하, 리드타임, 비용, 플래그 해석이 섹션에서는 공급망 CSV의 컬럼 의미와 메타데이터를 정의합니다. 필드를 비즈니스 개념에 매핑하고 단위와 세분성을 문서화하며 거버넌스와 재사용을 지원하는 사전을 생성합니다.
식별 세분성: SKU, 위치, 시간주요 컬럼의 비즈니스 의미 정의단위, 통화, 캘린더 문서화데이터 사전 생성 및 유지품질 플래그 및 상태 지표 태깅수업 8자동화 데이터 프로파일링: 분포, 결측 매트릭스, 고유 개수, 값 범위, 카디널리티이 섹션에서는 공급망 CSV의 자동화 프로파일링을 소개합니다. 분포, 결측 매트릭스, 고유 개수, 범위, 카디널리티를 계산하여 데이터 품질을 빠르게 평가하고 정제 작업을 우선순위화합니다.
대규모 요약 통계 생성결측 매트릭스 및 히트맵 시각화값 범위 및 범위 초과 데이터 분석키 및 카테고리 카디널리티 검사pandas 및 R 도구를 사용한 자동화 프로파일링수업 9결측값 탐지 및 처리: 컬럼별 보간 전략(수요, 예측, 재고, 비용) 및 행 삭제 시기이 섹션에서는 수요, 예측, 재고, 비용 필드의 결측값 분석 및 처리를 설명합니다. 보간 옵션을 비교하고 컬럼별 규칙을 설계하며 행 또는 세그먼트 삭제가 더 안전한 경우를 결정합니다.
결측 패턴 및 메커니즘 프로파일링단순 및 고급 수치 보간범주형 및 플래그 변수 보간공급망 필드의 컬럼별 규칙행 또는 시간 세그먼트 삭제 기준