본문 바로가기
728x90
반응형

뉴스 크롤링2

Python Beautifulsoup 네이버 뉴스 크롤링 (2) 본 포스팅에서는 이전 포스팅에 이어, python Beautifulsoup 모듈을 이용하여 작일 네이버 랭킹 뉴스의 제목을 크롤링하는 법을 다룬다. 저작권을 침해하지 않는 범위에서 이용해야함을 밝힌다. 04. 날짜 설정 네이버 뉴스의 랭킹 뉴스는 여러 날짜의 데이터를 가지고 있다. 따라서 url 설정 시 날짜 정보를 기입해야한다. 당일의 정보를 기입하면 그 날이 아닌 특정 시간대의 랭킹 뉴스가 뜨기 때문에, 불가피하게 작일 이전의 날짜만 유용하게 사용할 수 있다. 날짜를 조작하는 가장 쉬운 방법은 datetime 모듈을 사용하는 것이다. 소스코드는 다음과 같다. from datetime import datetime, timedelta t = datetime.today() - timedelta(1) #오늘.. 2020. 3. 31.
Python Beautifulsoup 네이버 뉴스 크롤링 (1) 본 포스팅에서는 python Beautifulsoup 모듈을 이용하여 작일 네이버 랭킹 뉴스의 제목을 크롤링하는 법을 다룬다. 저작권을 침해하지 않는 범위에서 이용해야함을 밝힌다. 01. 들어가며 이번 주제는 입대한 친구에게 사회 소식을 전해주고 싶다는 생각에서 시작했다. 물론 자대에서는 휴대전화 사용이 가능해졌지만, 훈련소에서만큼은 사회와 단절되어 있을 수밖에 없다. 그래서 위문편지를 통해 사회 소식을 전해주고 싶었다. 위문편지에는 글자 수 제한 등 조건이 있기 때문에 가장 핫한 뉴스의 제목들만 보내기로 했고, 직접 자료를 모으는 것이 귀찮았기 때문에 파이썬을 이용하여 자동으로 뉴스 제목을 가져오는 프로그램을 만들기로 했다. 02. 개요 네이버 뉴스의 랭킹 뉴스들의 제목을 수집하는 프로그램을 만든다. .. 2020. 3. 31.
728x90
반응형