본문 바로가기

머신러닝8

[Pandas] DataFrame 객체 판다스 : 파이썬에서 행과 열로 이뤄진 2차원 데이터를 효율적으로 가공/처리를 위해 존재하는 가장 인기 있는 라이브러리 DataFrame 여러 개의 행과 열로 이뤄진 2차원 데이터를 담는 데이터 구조체 칼럼이 여러 개인 데이터 구조체 Index를 key값으로 가지고 있음 여러 개의 Series로 이루어졌다고 할 수 있음 csv, tab : 분리 문자, 칼럼을 분리한 파일을 손쉽게 DataFrame으로 로딩할 수 있게 해줌 Index 개별 데이터를 고유하게 식별하는 Key 값 ex. RDBMS의 PK 인덱스는 단순 순차값 x, 고유성 보장 문자열도 가능 Series 칼럼이 하나 뿐인 데이터 구조체 Index를 key값으로 가지고 있음 파일을 DataFrame으로 로딩, 기본 API https://www.k.. 2021. 5. 19.
[numpy] ndarray, 행렬 정렬 * 교재 : 파이썬 머신러닝 완벽 가이드 머신러닝 : 애플리케이션을 수정하지 않고도 데이터를 기반으로 패턴을 학습하고 결과를 예측하는 알고리즘 기법 - 데이터를 기반으로 숨겨진 패턴을 인지, 해결 머신러닝은 다음과 같이 나뉜다. 지도학습 비지도학습 강화학습 지도학습의 대표적인 머신러닝 분류 (Classification) 회귀 (Regression) 추천 시스템 시각/음성 감지/인지 텍스트 분석, NLP 비지도학습의 대표적인 머신러닝 클러스터링 차원 축소 강화학습 머신러닝의 가장 큰 단점은 데이터에 매우 의존적이라는 것이다. -> 가비지 인, 가비지 아웃. 쓰레기가 들어가면 쓰레기가 나온다는 뜻 좋은 품질의 데이터를 갖추지 못한다면 결과도 나쁘다. 딥러닝 프레임워크인 텐서플로우, 케라스, 파이토치 등 파이.. 2021. 5. 5.