본문 바로가기
머신러닝

[Pandas] apply lambda 식으로 데이터 가공

by 수픽 2021. 6. 1.

≫ apply 함수에 lambda 식 결합

판다스에서는 칼럼에 일괄적으로 데이터 가공을 하는 것이 속도 면에서 더 빠르지만, 복잡한 데이터 가공이 필요할 경우 apply lamda를 사용한다.

 

lamda         x  :              x +2 

        입력 인자입력 인자를 기반으로 한 계산 식, 호출 시 계산 결과가 반환

 

Name 칼럼의 문자열 개수를 Name_len 칼럼에 넣어보자.

그리고 15세 미만이면 Child, 아니라면 Adult로 구분하는 새로운 칼럼 Child_Adult를 apply lambda를 이용해 만들어보자.

titanic_df['Name_len']=titanic_df['Name'].apply(lambda x : len(x))
titanic_df['Child_Adult'] = titanic_df['Age'].apply(lambda x : 'Chlid' if x <=15 else 'Adult')
titanic_df[['Age','Child_Adult']].head(8)

if 절의 경우 if 식보다 반환 값을 먼저 기술해야한다는 점에 주의하자.

또, ifelse만 지원하고 else if는 지원하지 않는다.

결과