본문 바로가기

DataFrame3

파이썬 '판다스 데이터 분석' - 데이터프레임에 함수 적용 .apply() 데이터프레임의 개별 원소를 특정 함수에 일대일 대응시키는 과정을 함수 매핑이라고 한다. 람다 함수를 포함하여 사용자 정의 함수를 적용할 수 있기 때문에 판다스 기본 함수로 처리하기 어려운 복잡한 연산을 데이터프레임 등 판다스 객체에 적용하는 것이 가능하다. import seaborn as sns titanic = sns.load_dataset('titanic') df = titanic.loc[:,['age','fare']] df['ten'] = 10 df.head() agefareten 022.07.250010 138.071.283310 226.07.925010 335.053.100010 435.08.050010 df.info() RangeIndex: 891 entries, 0 to 890 Data co.. 2021. 7. 25.
파이썬 '판다스 데이터 분석' - 복사 , DataFrame.copy() DataFrame 복사에 대해 테스트 Make a copy of this object’s indices and data. DataFrame.copy(deep=True) df2 = df df3 = df[:] df3 = df.copy() # deep = True (default) df2 = df # 복사 테스트 # df2 = df df2.tail() 39444.04.097.052.002130.024.682.02.0vw pickup 39532.04.0135.084.002295.011.682.01.0dodge rampage 39628.04.0120.079.002625.018.682.01.0ford ranger 39731.04.0119.082.002720.019.482.01.0chevy s-10 398NaNNaN.. 2021. 7. 11.
파이썬 '판다스 데이터 분석' - 데이터프레임 구조(shape, info(),describe(),value_counts()..), 통계함수(mean(), median(), min(), max(), std(), corr()) 데이터셋의 내용과 구조를 개략적으로 살펴볼 수 있는 함수들과 통계함수들을 살펴볼 것이다. 데이터프레임 구조 import pandas as pd df = pd.read_csv('data/auto-mpg.csv', header=None) # 열 이름 지정 df.columns= ['mpg','cylinders','displacement','horsepower','weight', 'acceleration','model year','origin','name'] df.head() mpgcylindersdisplacementhorsepowerweightaccelerationmodel yearoriginname 018.08307.0130.03504.012.0701chevrolet chevelle malibu 115.0.. 2021. 7. 8.