본문 바로가기

Python

(47)
Python _ 날짜 SETTING, 주차의 첫번째 또는 마지막 날짜 # 날짜 기준 SETTING 2)금주 주차의 마지막 날짜 import datetime d = '2024-W1' #금주 주차 입력 end_of_thisweek = datetime.datetime.strptime(d + '-1', '%G-W%V-%u') + datetime.timedelta(days=6) end_of_thisweek # 날짜 기준 SETTING 3)점검 시작 주차의 첫번째 날짜(date) f = '2023-W20' #점검 시작 주(최초 setting 후 변동 없음) firstdate_ofthisseason = datetime.datetime.strptime(f + '-1', '%G-W%V-%u') firstdate_ofthisseason
Python _ 이번주 주차 검색 / 설정 (오늘 날짜, 날짜 설정) # 날짜 기준 SETTING 1)오늘 기준 날짜 import datetime thisweek = datetime.date.today().isocalendar()[1] #금주 주차 thisyear = datetime.date.today().isocalendar()[0] #오늘 년도 #start_of_week = my_dt_trunc - timedelta(days = my_dt_trunc.weekday()) today = datetime.date.today() #오늘 날짜 thisweek
파이썬_pandas 엑셀 파일 읽어오기 pip install xlrd
파이썬_컬럼명 리스트로 받기 Get Column Names as List in Pandas DataFrame 방법1= list(df) 방법2=df.columns.values.tolist()
현재 사용 가능한 파일 링크 확인 %pwd
텍스트 마이닝_데이터 전처리, 불용어 제거 함수 ## 아래와 같이 규칙 생성 ## from sklearn.feature_extraction.text import CountVectorizer vect = CountVectorizer(tokenizer=None, stop_words="english", analyzer='word').fit(특정리스트) # tokenizer = 텍스트 데이터가 들어왔을 때 어떻게 단어를 나눠줄 지 정의 #(default일 경우 None, 한국어의 경우 별도 지정하여 기입 필요) # stop_words = 불용어 #(영어의 경우 into, the, he "english"로 설정하면 됨/ 한국어의 경우 은는이가, 그) #analyzer = 분석 단위 bow_vect = vect.fit_transform(특정리스트) word_li..
텍스트마이닝 특정 단어가 이 문장에는 많이 등장했으나, 다른 문서에서는 적게 등장했을 경우, 이 문장에서 가장 중요한 단어이다 라는 가설에 기반한 텍스트 마이닝 공식
파이썬_선택한 row 원하는 개수만큼 복사,추가하기 1. df를 n번 반복해서 아래쪽으로 row로 추가할 때 pd.concat([df]*n, ignore_index=True) 2. df1의 각 row를 [lpn개수]칼럼의 숫자만큼 각각 복사할 때 df2=df1.loc[np.repeat(df1.index.values,df1.lpn개수)] 예시 ### 코드 분해 ###
파이썬_한 칼럼 내 모든 데이터에 동일한 문자열 추가 #10월 데이터프레임, 판매 칼럼의 모든 데이터에 '2020_'라는 문자열 추가 10월['판매']='2020_'+10월['판매']
파이썬_append 함수 활용 (데이터프레임 여러개를 하나로 통합) # df라는 dataframe에 file1의 dataframe을 아래로 쭉 이어 붙이는 함수 df=df.append(file1, ignore_index=True) # 여러개 엑셀 파일 열기 후 하나의 파일로 통합하여 저장 import pandas as pd import numpy as np import xlrd import os from xlrd import open_workbook PO = ['91125','91125','91209','91209','91216','91224','9122S','200106','200106','200114','200114','200120','200120', '200127','200127W','200203','200203W','200217E','200217','200320'..