목록python (76)
sein-choi 님의 블로그
데이터프레임의 결측치 처리와 중복 제거, 피벗테이블 데이터프레임 생성하기import pandas as pdimport numpy as npdata = { '이름': ['철수', '영희', '민수', '지영', '영희', '철수', '철수', np.nan, '민수', '영희'], '학년': [1, 2, 3, 4, 2, 1, np.nan, 4, 3, np.nan], '국어': [90, 85, 92, 78, 85, 90, 90, 78, 92, 85], '수학': [88, 79, 94, 83, 79, 88, 88, 83, 94, np.nan], '영어': [82, 91, 85, 87, 91, 82, 82, 87, np.nan, 91] } ..
import pandas as pdimport seaborn as sns # seaborn 라이브러리에서 제공하는 데이터 불러오기위해서 사용 data = sns.load_dataset('tips')data ✅데이터 저장하기 data.to_csv('파일경로/파일명.확장자') 🔶현재 위치에서 tips_data.csv 파일 저장하기data.to_csv('tips_data.csv') 🔶temp 폴더에 tips_data.csv 파일 저장하기data.to_csv('temp/tips_data.csv') ✅데이터 불러오기pd.read_csv('파일경로/파일명.확장자')df = pd.read_csv('tips_data.csv')df 🔶Unnamed 컬럼이 존재하는 이유데이터를 저장하거나 불러올 때 별도로 인덱스..
pandas란?python에서 데이터를 조작하고 쉽게 분석할 수 있게 도와 주는 라이브러리- 대용량 데이터 처리가 가능하다- 데이터를 쉽게 가공할 수 있다- 데이터 시각화 기능을 제공한다 pandas에서 사용되는 대표적인 데이터 오브젝트 : 시리즈(Series)와 데이터프레임(DateFrame) 인덱스 : 데이터의 각 항목을 식별하는 것을 도와주는 목록인덱스는 각 행마다 부여되고, 시리즈 or 데이터프레임에서 특정 정보를 찾고자 할 때 사용한다
데이터프레임의 결합 데이터프레임 생성하기import pandas as pddf1 = pd.DataFrame({'A' : [1, 2], 'B' : [3, 4]})df2 = pd.DataFrame({'A' : ['ㄱ', 'ㄴ'], 'B' : ['ㄷ', 'ㄹ']})display(df1)display(df2) ✅데이터를 행 방향으로 연결 : concat([df1, df2...], axis = 0)컬럼의 이름이 동일해야 합쳐진다concat_row = pd.concat([df1, df2], axis = 0)concat_row ✅데이터를 방향으로 연결 : concat([df1, df2...], axis = 1) 인덱스가 동일한 형태로 존재해야한다동일한 이름의 컬럼을 사용하지않아야한다concat_col = pd.co..
데이터프레임 조작 심화 데이터프레임 생성하기1️⃣import pandas as pd data1 = {'이름': ['철수', '영희', '민수', '지민', '서연', '준호', '하영', '도윤', '유진', '지우'], '나이': [25, 30, 28, 22, 35, 27, 32, 31, 29, 24], '성별': ['남', '여', '남', '여', '여', '남', '여', '남', '여', '여']}df1 = pd.DataFrame(data1)df1 데이터프레임 생성하기2️⃣data2 = { '국어': [82, 95, 76, 88, 93, 85, 91, 72, 64, 89], '수학': [78, 83, 88, 92, 79, 85, 90, 81, 87, 94], '영어': [90, ..
데이터프레임 열 조작과 정렬 데이터프레임 생성하기1️⃣import pandas as pd data = {'이름': ['철수', '영희', '민수', '지민', '서연', '준호', '하영', '도윤', '유진', '지우'], '나이': [25, 30, 28, 22, 35, 27, 32, 31, 29, 24], '성별': ['남', '여', '남', '여', '여', '남', '여', '남', '여', '여']}df = pd.DataFrame(data)df ✅특정 열 선택하기1️⃣대괄호 [ ]# 단일 열 선택df['열 이름']# 여러 열 선택df[['열1', '열2', '열3']] 2️⃣. 도트 연산df.열이름 3️⃣locdf.loc[:, '열 이름'] 4️⃣ilocdf.iloc[:, '열의 정수 위치']..