2025/04/04 2

[KT AIVLE DX 트랙 7기] 기술통계

KT 에이블스쿨 7기 DX 트랙에 기자단으로 신청하기도 하였고, 복습을 통한 역량을 강화, 습득을 목적으로 작성되었음을 알려드립니다. 그럼, 복습 Let's go  기술통계기술통계는 데이터를 정리하고 요약하는 방법으로, 데이터의 전반적인 특성을 파악하는 데 사용되는 통계 기법이다.즉, 복잡한 데이터를 한눈에 이해하고, 이애할 수 있도록 요약하는 과정 먼저, Numpy 와 DataFrame을 가져왔습니다. (본인이 헷갈림..) numpy.mean(a, axis=None, dtype=None, out=None, keepdims= value>, *, where= value>)https://numpy.org/doc/2.2/reference/generated/numpy.mean.html class pandas.D..

[KT AIVLE DX 트랙 7기] 데이터 전처리

KT 에이블스쿨 7기 DX 트랙에 기자단으로 신청하기도 하였고, 복습을 통한 역량을 강화, 습득을 목적으로 작성되었음을 알려드립니다. 그럼, 복습 Let's go 데이터 전처리데이터 분석에서 데이터 전처리는 필수적인 과정이다. 실제 데이터는 결측치, 이상치, 중복 데이터뿐만 아니라 범주형 데이터, 서로 다른 스케일, 다양한 형식을 포함할 수 있다.이를 정리하고 변환하여 모델이 학습할 수 있는 최적의 형태로 가공하는 과정이 필요합니다. Scikit-Learn (사이킷런) scikit-learn은 Python에서 머신러닝과 데이터 전처리를 위한 가장 널리 사용되는 라이브러리입니다. 머신러닝 모델을 쉽게 구축하고, 학습시키고, 평가할 수 있도록 다양한 기능을 제공합니다. sklearn은 Numpy, SciPy..