본문 바로가기
Language/파이썬

파이썬 '판다스 데이터 분석' - 함수 : sample(), .at[idx,'컬럼명'],pop('컬럼명') ,nlargest(idx, list), isin([])

by javapp 자바앱 2021. 7. 14.
728x90

그 밖의 df 함수

 

랜덤한 한 행의 데이터 보기

df.sample()
<결과>
	mpg	cylinders	displacement	horsepower	weight	acceleration	model year	origin	name
255	25.1	4		140.0		88.00		2720.0	15.4		78		1 	ford fairmont (man)

 

 

하나의 값에 접근

df.at[idx, '컬럼명']

df.at[397,'mpg']
<결과>
31.0

 

한 컬럼 전체가 반환되고 원 데이터프레임에서 drop 된다.

Return item and drop from frame. Raise KeyError if not found.

df.pop('mpg')

 

 

가장 큰 값 n 번째까지 리턴

df.nlargest(idx, list)

>>> df.nlargest(3, ['a', 'c'])
    a  b    c
3  10  c  3.0
1  10  b  2.0
2   8  d  NaN

 

DataFrame의 각 요소가 값에 포함되는 지->Boolean

.isin([])

df['add'].isin([32.0, 48.0])
<결과>
0       True
1       True
2      False
3      False
4      False
       ...  
886    False
887    False
888    False
889    False
890    False
Name: add, Length: 891, dtype: bool

 

<활용>
df.loc[changed_df_,:]
	age	fare	ten	add
0	22.0	7.2500	10	32.0
1	38.0	71.2833	10	48.0
25	38.0	31.3875	10	48.0
60	22.0	7.2292	10	32.0
61	38.0	80.0000	10	48.0

...

댓글