본문 바로가기
💻 개발블로그/파이썬문법

파이썬 크롤링하기(웹스크래핑) 3주차 과제

by August.J 2021. 12. 15.

지니뮤직사이트 순위/제목/가수 스크래핑하기

 

뷰티풀숩을 이용해 셀렉트하고 카피를 해두면 편리하다. 

 

스크래핑할 내용 한 개 찾기 .select_one()

여러개 찾기 .select

data = requests.get('https://www.genie.co.kr/chart/top200?ditc=M&rtm=N&ymd=20210701',headers=headers)

soup = BeautifulSoup(data.text, 'html.parser')

#body-content > div.newest-list > div > table > tbody > tr:nth-child(1) > td.number
#body-content > div.newest-list > div > table > tbody > tr:nth-child(1) > td.info > a.title.ellipsis
#body-content > div.newest-list > div > table > tbody > tr:nth-child(1) > td.info > a.artist.ellipsis

genie = soup.select('#body-content > div.newest-list > div > table > tbody > tr')

for music in genie:
    rank = music.select_one('td.number').text[0:2].strip( )
    title = music.select_one('td.info > a.title.ellipsis').text.strip( )
    artist = music.select_one('td.info > a.artist.ellipsis').text
    print(rank, title, artist)