#2 웹 크롤링을 이용한 텔레그램 봇 만들기

중간고사 끝나고 2주동안 이거 만드느라 아무것도 못했다.
자비스 같은 개인 비서를 만들고 싶었다.
그래서 실생활에서 내가 하고 있는 것들을 버튼 하나로 출력 값이 나오는 봇을 만들었다.
날씨 검색과 현재 핫 뉴스 검색이다.

소스 코드는 https://github.com/kbj2060/Data_Analysis 에 올려놨다.
소스 코드는 2가지로 이루어져있다.
첫번째는 기상청에서 zone_code 를 긁어서 데이터 베이스에 넣는 코드
두번째는 텔레그램 api를 이용해 봇을 만드는 코드이다.
class 는 weather와 news와 마지막으로 telegram api를 이용해 데이터를 출력하는 bot이 있다.

1. 날씨 검색

흠..날씨 검색은 기상청 RSS를 이용해 정보를 긁어왔다.
참 복잡하다. 전국에 있는 zone_code를 긁어와야했다.
3000개의 zone_code를 손으로 하기엔 무리가 있었다.
그래서 웹 자동화인 selenium을 이용했다.
selenium과 BeautifulSoup을 이용해 버튼 클릭하고 웹페이지 정보를
스크래핑하는 코드를 만들어야했다.
스크래핑 후 몽고 디비에 zone_code 와 zone_code에 맞는 지역 이름으로 딕셔너리를 만들어 몽고 디비에 insert했다.
그 후엔 이제 지역을 설정하면 zone_code를 불러와 URL + zone_code 로 그 지역의
날씨를 불러왔다.

2. 핫 뉴스 검색

이건 그냥 네이버 현재 핫 뉴스를 BeautifulSoup을 이용해 긁어 왔다.
또 할 게 없어 그냥 몽고 디비에 계속 넣고 있다.



댓글

이 블로그의 인기 게시물

윈도우 설치에서 파티션 설정 오류(NTFS)

[exploit writing] 1_스택 기반 오버플로우 (1) First

하둡 설치 오류 정리