Python (47) 썸네일형 리스트형 파이썬_특정 칼럼에 결측치가 포함된 행 제거 #목표 : 특정 칼럼에 결측치가 포함된 행 제거 #결론 : data=data[['칼럼명']].dropna() data=data[data['칼럼명'].notna()] #예시 : 과일가게 판매량이다. 하루도 빠짐없이 판매된 과일의 판매추이만 확인하고 싶다. 월요일 화요일 수요일 수박 3 4 n/a 오렌지 2 n/a 1 포도 2 5 1 data=data[['월요일','화요일','수요일']].dropna() data=data[data['화요일','수요일].notna()] 파이썬_데이터프레임 내 모든 데이터 일괄 유형 변경 #목표 : 데이터프레임 내 모든 데이터 일괄 유형 변경 #결론 : data1=data1.applymap(str) 오답 결과: data1=data1.apply(str) 정답 결과: data1=data1.applymap(str) . 파이썬_칼럼 내 모든 데이터에 문자/숫자 추가 #목표 : 칼럼 내 모든 데이터에 문자/숫자 추가 #결론 : ① df.col_1 = df.col_1 + '추가하고싶은문자' : 이 경우 맨 뒤에 추가됨 ② df.col_1 += '추가하고싶은문자' : 이 경우 맨 뒤에 추가됨 ③ df['col_1'] ='추가하고싶은문자' + df1['col_1'].astype(str) : 이 경우 맨 앞에 추가됨 data1.head() data1['컬럼명#']='0'+data1['컬럼명'] data1.head() . 파이썬 _ 엑셀의 filter, sumif 기능 (파싱,인덱싱) # 목표 : 칼럼의 특정 데이터만 추출 및 해당 데이터로 연산 # 결론 : df[df['칼럼명']=='필터링 원하는 데이터'] : df[df['칼럼명']=='필터링 원하는 데이터'].연산() - 데이터의 '구분' 칼럼(열) 중에 일부를 필터링 하여 데이터 추출 - '구분'컬럼의 특정 데이터 추출 후 합계 . 엑셀파일 읽기 후 데이터 유형 변경 #목적 : 특정 칼럼의 데이터 유형을 string(object)로 변경하고자 한다. #결론 : 엑셀파일 읽어오면서 데이터 유형 바로 변경 필요. #방법1. file['칼럼명']=file['칼명명'].apply(str) - 파일 읽어 온 후, 특정 칼럼의 데이터유형 변경. - 처음에는 문제 없이 실행되었으나, 데이터양 증가 및 여러 함수 적용 후 아래와 같은 결과 도출. #방법2. file=pd.read_excel(file, engine='xlrd', dtype={'칼람명':str, '칼럼명':int}) - 파일 읽어 들일 때 데이터 유형 변경하면, 오류없이 데이터유형 유지 가능. . 파이썬 엑셀파일 읽기 #목표 : 엑셀파일 열기 #결론 : OPTION1이 간단한 방법(흔한 방법)이지만, 아래와 같은 오류 발생 시 OPTION2 시도 OPTION1) - 실행 결과 아래와 같은 오류 메시지 뜸 # WARNING *** file size (36390) not 512 + multiple of sector size (512) OPTION2) - 해결방법 : os와 xlrd를 각각 import 후 workbook 형태로 open한 뒤 read_excel 실행 숫자로 이루어진 문자열(일렬번호) 자르기, 칼럼 나누기 (인덱싱) #목표: 일렬번호(LPN#)를 첫 3자리, 다음 5자리, 다음 3자리, 마지막 1자리로 끊어서 각기 새로운 칼럼으로 기입 #결론: data['칼럼명'].str[시작점:끝점+1] 자르고 싶은 구간 입력 - 오답 결과: 이미 LPN#칼럼의 데이터는 string 으로 데이터 변환 완료한 상태. 리스트 형태로 반환하여 0~5까지 가져오라고 했더니 일렬번호 1번부터 5번까지 가지고 옴. - 정답 결과: LPN#칼럼의 데이터는 string 으로 데이터 변환 완료했더라도 LPN# 칼럼을 string으로 변경하면서 0번째부터 4번째자리 객체를 하나씩 가져옴. 이전 1 2 3 4 5 다음