전체 글70 [사이킷런] 사이킷런 소개와 붓꽃 품종 예측하기 ≫사이킷런 소개와 특징 사이킷런(scikit-learn)은 파이썬 기반의 머신러닝을 위한 가장 쉽고 효율적인 개발 라이브러리이다. 특징은 다음과 같다. - 쉽고 가장 파이썬스러운 API 제공 - 머신러닝을 위한 매우 다양한 알고리즘과 편리한 프레임워크, API 제공 - 오랜 시간 실전 환경에 검증받아 성숙한 라이브러리 Anaconda를 설치하면 기본적으로 사이킷런까지 설치가 완료되고, sklearn.__version__으로 버전 정보를 확인할 수 있다. import sklearn print(sklearn.__version__) ≫머신러닝 만들기 - 붓꽃 품종 예측하기 붓꽃 데이터 세트는 꽃잎의 길이와 너비, 꽃받침의 길이와 너비 피처를 기반으로 꽃의 품종을 예측하기 위한 것이다. 분류(Classifica.. 2021. 6. 2. [Pandas] apply lambda 식으로 데이터 가공 ≫ apply 함수에 lambda 식 결합 판다스에서는 칼럼에 일괄적으로 데이터 가공을 하는 것이 속도 면에서 더 빠르지만, 복잡한 데이터 가공이 필요할 경우 apply lamda를 사용한다. lamda x : x +2 입력 인자 : 입력 인자를 기반으로 한 계산 식, 호출 시 계산 결과가 반환 Name 칼럼의 문자열 개수를 Name_len 칼럼에 넣어보자. 그리고 15세 미만이면 Child, 아니라면 Adult로 구분하는 새로운 칼럼 Child_Adult를 apply lambda를 이용해 만들어보자. titanic_df['Name_len']=titanic_df['Name'].apply(lambda x : len(x)) titanic_df['Child_Adult'] = titanic_df['Age'].a.. 2021. 6. 1. [Pandas] 정렬, Aggregation, GroupBy, 결손 데이터 * 교재 : 파이썬 머신러닝 완벽 가이드 정렬, Aggregation 함수, GroupBy 적용 * DataFrame과 Series 모두 포함 ≫ 정렬 (sort_values()) RDBMS SQL의 order by와 유사하다. 주요 입력 파라미터에는 - by : 특정 칼럼 입력 시 해당 칼럼으로 정렬 수행 - ascending : True는 오름차순, False는 내림차순 - inplace : False는 sort_values()를 호출한 데이터프레임은 그대로 유지하고 정렬된 데이터프레임을 결과로 반환. True는 호출한 데이터 프레임의 정렬 결과를 그대로 적용 titanic_df를 Name 칼럼으로 오름차순 정렬해보자. 여러 개의 칼럼으로 정렬하려면 리스트 형식으로 입력하면 된다. ≫ Aggregat.. 2021. 5. 26. [OpenPose/텐서플로우] 윈도우에서 OpenPose 환경 구성 :: 근데 아나콘다를 곁들인 * 참고 블로그 https://jin-t.tistory.com/4#comment5854351 + TENSORFLOW는 처음부터 1.14로 깔아라!! conda install -c conda-forge tensorflow-gpu=1.14 + 영상에서 나오는 깃허브는 만료됨 여기서 받기 https://github.com/gsethi2409/tf-pose-estimation gsethi2409/tf-pose-estimation Hey! This is a clone of the tf-pose-estimation by Ildoo Kim modified to work with Tensorflow 2.0+! - gsethi2409/tf-pose-estimation github.com https://jlog1016.t.. 2021. 5. 19. [Pandas] Index 객체와 데이터 셀렉션 및 필터링 ≫ Index 객체 RDBMS의 Primary Key와 같이 DataFrame, Series의 레코드를 고유하게 식별하는 객체이다. DataFrame.index, Series.index 속성을 통해 추출이 가능하다. titanic_df 데이터프레임에서 인덱스 객체를 추출해보자. 한 번 만들어진 Index 객체는 indexs[0] = 5 처럼 변경할 수 없으니 주의해야 한다. Series 객체에서 Index 객체는 연산에서 제외되고 오직 식별용으로만 사용된다. reset_index() 메서드를 수행하면 연속 int 숫자형 데이터로 만들 수 있다. 단, Series에 적용하면 기존 인덱스가 칼럼으로 추가되고, 칼럼이 2개가 되어 DataFrame이 반환된다. 파라미터 중 drop=True을 설정하면 기존 인.. 2021. 5. 19. [Pandas] DataFrame 객체 판다스 : 파이썬에서 행과 열로 이뤄진 2차원 데이터를 효율적으로 가공/처리를 위해 존재하는 가장 인기 있는 라이브러리 DataFrame 여러 개의 행과 열로 이뤄진 2차원 데이터를 담는 데이터 구조체 칼럼이 여러 개인 데이터 구조체 Index를 key값으로 가지고 있음 여러 개의 Series로 이루어졌다고 할 수 있음 csv, tab : 분리 문자, 칼럼을 분리한 파일을 손쉽게 DataFrame으로 로딩할 수 있게 해줌 Index 개별 데이터를 고유하게 식별하는 Key 값 ex. RDBMS의 PK 인덱스는 단순 순차값 x, 고유성 보장 문자열도 가능 Series 칼럼이 하나 뿐인 데이터 구조체 Index를 key값으로 가지고 있음 파일을 DataFrame으로 로딩, 기본 API https://www.k.. 2021. 5. 19. 이전 1 2 3 4 5 ··· 12 다음