파이썬으로 웹 스크래핑을 해보고 싶은데, 어떻게 시작해야 할지 막막하신가요? 걱정하지 마세요! 오늘은 파이썬을 사용해서 간단한 웹 스크래핑 예제를 준비해봤어요.
먼저, 웹 스크래핑을 위해 사용할 라이브러리인 BeautifulSoup와 requests를 설치해야 해요. 아래와 같이 명령어를 입력해서 설치해주세요.
pip install beautifulsoup4
pip install requests
이제 준비가 다 됐습니다! 예제로 네이버 실시간 검색어 순위를 스크래핑해보겠어요. 아래는 코드 예제입니다.
import requests
from bs4 import BeautifulSoup
url = 'https://www.naver.com'
response = requests.get(url)
soup = BeautifulSoup(response.text, 'html.parser')
rank_list = soup.select('.ah_roll .ah_l .ah_item')
for rank, item in enumerate(rank_list, 1):
keyword = item.select_one('.ah_k').text
print(f'{rank}위: {keyword}')
위 코드를 실행하면 네이버 실시간 검색어 순위가 출력될 거에요. 코드를 간단히 설명하자면, requests를 사용해서 네이버 홈페이지의 HTML 코드를 가져오고, BeautifulSoup를 사용해서 원하는 정보를 추출한답니다.
이렇게 파이썬을 사용해서 웹 스크래핑을 할 수 있어요. 물론, 스크래핑할 사이트의 이용 약관을 잘 따라야 한다는 건 잊지 말아주세요. 파이썬을 이용하면 웹 스크래핑이 쉽고 재미있어요. 여러분도 한 번 도전해보세요! 😉