Python/Study2 [Python] Webtoon Crawling (웹 크롤링) *학습용으로 공부한 것이며, 실습 종료 후 모두 삭제하였음 1. 기본 설정 from bs4 import BeautifulSoup import urllib.request import os,re # 태그, 공백 제거를 위해 필요 # HTTP Error 403: Access Denied 에러 제거. 봇 우회 opener=urllib.request.build_opener() opener.addheaders=[('User-Agent','Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/36.0.1941.0 Safari/537.36')] urllib.request.install_opener(opener) - 파싱을 위한.. 2020. 5. 29. [Python] 문자열과 리스트 문자열 함수 대소문자 변환 upper() : 모든 문자를 대문자로 변환 upper().lower() : 모든 문자를 소문자로 변환 이외에도 대문자를 소문자로, 소문자를 대문자로 바꿔주는 swapcase()와 첫문자를 대문자로 바꿔주는 capitalize() 등이 존재한다. 검색 find() : 문자열 앞쪽부터 's'를 검색해서 해당 인덱스를 리턴 rfind() : 문자열의 뒤쪽부터 's'를 검색해서 해당 인덱스를 리턴 count() : 문자열에서 괄호 안의 문자가 발생한 횟수를 리턴 index() : 괄호 안의 문자가 있는 인덱스를 리턴. 없으면 오류를 발생 편집 strip() : 괄호 안의 문자를 찾아서 삭제할 수 있고 아무것도 없다면 양쪽 공백을 삭제 시킨다. rstrip() : 오른쪽 공백을 없앤다.. 2020. 4. 12. 이전 1 다음