소셜 웹 마이닝 ch1 twitter
통계학을 배우기 전에 우선 데이터 스크래핑을 해봐야겠다는 생각에 소셜 웹 마이닝이라는 책을 사서 공부 중이다. 아래 코드는 한국 트위터에 맞게 수정해서 쓴 코드이다. # coding: utf-8 # API 인증 # In[1]: import twitter # In[2]: CONSUMER_KEY = '' CONSUMER_SECRET = '' OAUTH_TOKEN = '' OAUTH_TOKEN_SECRET = '' 키와 토큰은 트위터 사이트에서 받아야한다. 자세한 내용은 책에 있지만 생략한다. auth = twitter.oauth.OAuth(OAUTH_TOKEN,OAUTH_TOKEN_SECRET,CONSUMER_KEY,CONSUMER_SECRET) twitter_api = twitter.Twitter(auth=auth) 위처럼 api 인증을 받아야 트위터의 데이터를 스크래핑할 수 있다. # In[3]: WORLD_WOE_ID = 1 KOR_WOE_ID = 23424868 world_trends = twitter_api.trends.place(_id = WORLD_WOE_ID) kor_trends = twitter_api.trends.place(_id = KOR_WOE_ID) 트위터 api에 트렌드 클래스도 있다니 신기하다. # JSON을 이용해 보기 쉽게 하기 # In[4]: import json json 은 자바 스크립트 변환하는 걸로 알고 있었는데 여기서는 어떻게 쓰일지 궁금했다. # In[5]: print(json.dumps(world_trends,indent = 1,ensure_ascii=False)) print print(json.dumps(kor_trends,indent =1,ensure_ascii=False)) ensure_ascii=False 를 써야 한글이 깨지지 않고 잘 나왔다.. 자바 스크립트 ...