728x90
그 밖의 df 함수
랜덤한 한 행의 데이터 보기
df.sample()
<결과>
mpg cylinders displacement horsepower weight acceleration model year origin name
255 25.1 4 140.0 88.00 2720.0 15.4 78 1 ford fairmont (man)
하나의 값에 접근
df.at[idx, '컬럼명']
df.at[397,'mpg']
<결과>
31.0
한 컬럼 전체가 반환되고 원 데이터프레임에서 drop 된다.
Return item and drop from frame. Raise KeyError if not found.
df.pop('mpg')
가장 큰 값 n 번째까지 리턴
df.nlargest(idx, list)
>>> df.nlargest(3, ['a', 'c'])
a b c
3 10 c 3.0
1 10 b 2.0
2 8 d NaN
DataFrame의 각 요소가 값에 포함되는 지->Boolean
.isin([])
df['add'].isin([32.0, 48.0])
<결과>
0 True
1 True
2 False
3 False
4 False
...
886 False
887 False
888 False
889 False
890 False
Name: add, Length: 891, dtype: bool
<활용>
df.loc[changed_df_,:]
age fare ten add
0 22.0 7.2500 10 32.0
1 38.0 71.2833 10 48.0
25 38.0 31.3875 10 48.0
60 22.0 7.2292 10 32.0
61 38.0 80.0000 10 48.0
...
댓글