code:
import itertools
def crawl_site(url):
for page in itertools.count(1):
print(page)
pg_url = '{}{}'.format(url,page)
html = download(pg_url)
if html is None:
break
print(pg_url)
'웹(web) > 크롤링(web scraping)' 카테고리의 다른 글
로그인 시 쿠키를 안 돌려주는 경우 - 세션 이용 (0) | 2019.08.07 |
---|---|
regex training site (0) | 2019.07.07 |
crawl_sitemap() with re.findall() (0) | 2019.07.06 |
download() with num_tries (0) | 2019.07.06 |
naver html 페이지 다운로드(download() simple ver) (0) | 2019.07.06 |