본문 바로가기
728x90
반응형

크롤링3

Python으로 Mp3 파일 속성 편집하기 - 자동화 본 포스팅은 Python을 이용하여 Mp3 파일의 속성을 편집하는 내용을 다룬다. 파이썬 3.7, 윈도우 10 기반에서 이루어졌다. 01. 들어가며 이전 포스팅에서는 파이썬의 tkinter와 eyed3 모듈을 이용하여 Mp3 파일의 속성을 편집하는 프로그램을 만들었다. 하지만 우리가 만든 프로그램은 타이틀과 아티스트, 앨범 정보를 직접 타이핑하여 입력해주어야 했다. 음원에 대한 정보를 자동으로 입력되도록 만들 방법을 고민하다가, 음원 사이트를 크롤링해보자는 생각이 들었다. 이번 포스팅에서는 지난 포스팅의 결과를 바탕으로, 음원 정보를 크롤링하여 자동으로 넣어주고, 앨범 커버 이미지를 다운로드하는 프로그램을 만들 것이다. (사실 커버를 씌우고 가사까지 넣어보려 했지만, 어째서인지 실패했다...) 기본적인 .. 2020. 4. 10.
Python Beautifulsoup 네이버 뉴스 크롤링 (2) 본 포스팅에서는 이전 포스팅에 이어, python Beautifulsoup 모듈을 이용하여 작일 네이버 랭킹 뉴스의 제목을 크롤링하는 법을 다룬다. 저작권을 침해하지 않는 범위에서 이용해야함을 밝힌다. 04. 날짜 설정 네이버 뉴스의 랭킹 뉴스는 여러 날짜의 데이터를 가지고 있다. 따라서 url 설정 시 날짜 정보를 기입해야한다. 당일의 정보를 기입하면 그 날이 아닌 특정 시간대의 랭킹 뉴스가 뜨기 때문에, 불가피하게 작일 이전의 날짜만 유용하게 사용할 수 있다. 날짜를 조작하는 가장 쉬운 방법은 datetime 모듈을 사용하는 것이다. 소스코드는 다음과 같다. from datetime import datetime, timedelta t = datetime.today() - timedelta(1) #오늘.. 2020. 3. 31.
Python Beautifulsoup 네이버 뉴스 크롤링 (1) 본 포스팅에서는 python Beautifulsoup 모듈을 이용하여 작일 네이버 랭킹 뉴스의 제목을 크롤링하는 법을 다룬다. 저작권을 침해하지 않는 범위에서 이용해야함을 밝힌다. 01. 들어가며 이번 주제는 입대한 친구에게 사회 소식을 전해주고 싶다는 생각에서 시작했다. 물론 자대에서는 휴대전화 사용이 가능해졌지만, 훈련소에서만큼은 사회와 단절되어 있을 수밖에 없다. 그래서 위문편지를 통해 사회 소식을 전해주고 싶었다. 위문편지에는 글자 수 제한 등 조건이 있기 때문에 가장 핫한 뉴스의 제목들만 보내기로 했고, 직접 자료를 모으는 것이 귀찮았기 때문에 파이썬을 이용하여 자동으로 뉴스 제목을 가져오는 프로그램을 만들기로 했다. 02. 개요 네이버 뉴스의 랭킹 뉴스들의 제목을 수집하는 프로그램을 만든다. .. 2020. 3. 31.
728x90
반응형