In [1]:
###LABEL ENCODING###
from sklearn.preprocessing import LabelEncoder
items=['냉장고','전자레인지','컴퓨터','선풍기','믹서','믹서']
encoder=LabelEncoder()
encoder.fit(items)
labels=encoder.transform(items)
print(labels)
In [2]:
print(encoder.classes_)
In [8]:
###ONE-HOT ENCODING###
from sklearn.preprocessing import OneHotEncoder
import numpy as np
items=['냉장고','전자레인지','컴퓨터','선풍기','믹서','믹서']
encoder=LabelEncoder()
encoder.fit(items)
labels=encoder.transform(items)
labels=labels.reshape(-1,1)
oh_encoder=OneHotEncoder()
oh_encoder.fit(labels)
oh_labels=oh_encoder.transform(labels)
oh_labels.toarray()
Out[8]:
In [10]:
###GET DUMMIES###
import pandas as pd
df=pd.DataFrame({'item':['냉장고','전자레인지','컴퓨터','선풍기','믹서','믹서']})
df.head()
Out[10]:
In [11]:
pd.get_dummies(df)
Out[11]:
'Python' 카테고리의 다른 글
파이썬_loc으로 특정조건을 가진 칼럼의 데이터 변경 (0) | 2020.09.08 |
---|---|
파이썬_for loop 두가지 이상의 for 조건 설정 (0) | 2020.09.08 |
파이썬_회귀분석의 성능평가 (0) | 2020.09.02 |
파이썬_특정 칼럼의 결측치를 문자로 대체 (0) | 2020.08.26 |
파이썬_특정 칼럼에 결측치가 포함된 행 제거 (0) | 2020.08.26 |