파이썬_데이터 전처리 (Encoding) Data Preprocessing, GET DUMMIES #2
■의미 머신러닝에서 문자로 된 데이터는 모델링이 되지 않는다. 회귀분석 또한 데이터가 숫자로 이루어져야 learn 가능하다. 문자를 숫자로 바꾸어 주는 방법 중 하나로 get dummies 함수가 있다. 더미변수(가변수,dummy variable)를 만들어, 각 열에 0과 1로 표현되는 방식이다. 1은 있다/맞다, 0은 없다/아니다를 나타낸다. ■표현식 pandas.get_dummies(data, prefix=None, prefix_sep='_', dummy_na=False, columns=None, sparse=False, drop_first=False, dtype=None) pd.get_dummies(데이터프레임명,column=['칼럼명']) #특정칼럼만 처리할 경우 ■활용예시 ★ pd.get_dum..