목록python (76)
sein-choi 님의 블로그
데이터프레임의 데이터 필터링 데이터프레임 생성하기import pandas as pd data = {'이름': ['철수', '영희', '민수', '지민', '서연', '준호', '하영', '도윤', '유진', '지우'], '나이': [25, 30, 28, 22, 35, 27, 32, 31, 29, 24], '성별': ['남', '여', '남', '여', '여', '남', '여', '남', '여', '여']}df = pd.DataFrame(data)df ✅불리언 인덱싱1️⃣필터링 조건 만들기 : 나이가 27살 이상인지 여부에 대한 불리언 값들의 시리즈 생성above_27 = df['나이'] >= 27above_272️⃣조건을 데이터프레임에 적용하기above_27_df = df[above_27]above_2..
데이터프레임의 인덱스와 슬라이싱 데이터 생성하기import pandas as pd data = {'이름': ['철수', '영희', '민수', '지민', '서연', '준호', '하영', '도윤', '유진', '지우'], '나이': [25, 30, 28, 22, 35, 27, 32, 31, 29, 24], '성별': ['남', '여', '남', '여', '여', '남', '여', '남', '여', '여']}df = pd.DataFrame(data)df ✅레이블 기반 인덱싱 : df.loc[row_label, col_label]인덱스의 레이블(이름)을 사용하여 데어터에 접근# 첫번째 행만 출력df.loc[0] # '나이' 열만 출력df.loc[: , '나이']# 첫번째 행의 '나이' 컬럼만 출력df.loc[0..
데이터프레임의 속성과 메서드 데이터프레임 생성하기import pandas as pdnames = ['짱구', '짱아', '봉미선', '신형만']ages = [5, 0, 29, 35]genders = ['남', '여', '여', '남']data = {'이름' : names, '나이' : ages, '성별' : genders}df = pd.DataFrame(data)df ✅데이터프레임의 열 이름 반환하기 : df.colunms 🔶df.columns를 사용해서 컬럼이름 변경하기df.columns = ['name', 'age', 'gender']df✅데이터프레임의 인덱스 반환하기 : df.index 인덱스를 별도로 지정한 경우만약 인덱스를 'a', 'b', 'c' , 'd' 로 지정했다면 ✅데이터프레임의 ..
데이터프레임 생성하기 ✅데어터프레임pandas(판다스)에서 제공하는 자료구조 중 하나열(column)과 행(row)으로 이루어진 2차원 데이터 구조 데이터프레임 구성 열(column) 서로 다른 유형의 데이터를 담을 수 있는 시리즈로 구성되어 있다각 열은 열 이름으로 식별된다 행(row)데이터프레임의 하나의 레코드를 나타낸다각 행은 고유한 인덱스를 가지며 각 열에 해당하는 데이터가 저장된다 ✅딕셔너리로 데이터프레임 생성하기딕셔너리에서 키(key)에는 컬럼이름이 들어가고 값(value)에는 데이터가 들어간다dictionary = {'컬럼이름1' : [1, 2, 3, 4, 5],'컬럼이름2' : ['a', 'b', 'c', 'd', 'e']}df = pd.DataFrame(dictionary)df ✅리스트로..
결측치와 중복값 ✅결측치데이터 누락 즉, 데이터가 존재해야하는데 값이 입력되지 않은 경우를 의미 python에서 결측치 : None, np.nan- None : 일반적인 형태의 결측치- np.nan : 넘파이(Numpy)라이브러리에서 사용되는 값으로 부동 소수점 형태의 결측치를 나타냄 시리즈 생성하기import pandas as pddata = [10, 20, None, 40, 50, None, 50, 40, 30]index = ['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i']series = pd.Series(data, index = index)series ✅결측치 제거 : dropna( )dropna_series = series.dropna()dropna_series ✅..
데이터 변환 시리즈 생성하기import pandas as pddata = [1,2,3,4,5]series = pd.Series(data) ✅시리즈에 함수를 적용하는 메서드 : apply( )각 요소에 사용자 정의 함수, 내장 함수를 적용할 수 있다시리즈의 각 요소에 특정 연산 or 복잡한 연산을 적용할 떄 사용한다def custom_def (x): if x >= 3: result = x + 1 else: result = x - 1 return resultresult_series = series.apply(custom_def)result_series tip!apply( ) 함수는 시리즈 내의 각 요소에 함수를 적용하여 반환된 결과를 새로운 시리즈로 반환한다사용자 정..