tweepyを使ってtwitterの#ハッシュタグ解析をしてみた

ハッシュタグのイメージ
hashtag | Duc Ly | Flickr

今回はtweepyを使って、twitterのハッシュタグを調べてみました。

空いている時間は前と比べてだいぶ増えたので、またなにか新しいことにチャレンジしたいと思っています。体動かす系のなにか!

ハッシュタグ解析をやろうと思ったきっかけ

時間がないのでやりたいときにできるような仕事を探すためにランサーズを眺めていると、「instagram自動投稿」や「メルカリ自動出品」,「Twitter 作業 代行」などの仕事がたくさんあることに気づきました。単価としてはやすいですが、チリも積もれば山となるです。

Pythonをずっと勉強していたので、このくらいPythonにやらせたらいいんじゃないかと思って作ってみようと思いました。

TwitterがAPIがあって簡単そうだったので、やってみました。

tweepyをつかえばTwitterでの作業は全部できる!

tweepyの使い方はいろんなサイトで紹介されていて、思い出せないくらい探し回ったのでどのサイトが参考になったかは割愛します。強いていうなら、一番tweepyの参考になった記事はこれです。

Pythonで特定のキーワードが付与されたツイート収集する方法 - Qiita
はじめにPythonを使ってツイートを収集する方法を紹介します。私的には最も簡単な方法だと思ってます。以下の2つの方法のコードを書いています。特定のキーワードやハッシュタグが付与されたツイート…

仕事の内容に必要なのは、特定のワードに関するツイートをしたアカウントのフォローワー数を獲得しある一定以上のフォローワー数がいるアカウントをリストにすること。

.followers_countと.searchを使えばすぐできました。ツイートを調べて、フォローワー数を獲得、if文を用いて条件分岐でさいごにIDとフォローワー数をエクセルに書き込んで終わり!

プログラムを動かせば、10秒もかからずできちゃいます。一件100円ちょっとなので、2分もあれば1000円稼げる!

他にもいろんなことができるらしくて、前からやってみたかったハッシュタグ解析をやってみました。

#okinawaのハッシュタグ解析

#okinawa,#tripを検索して、この2つのハッシュタグが付いているツイートにはほかにどんなハッシュタグが付いているか調べてみました。

.searchで調べて、2つのハッシュタグが付いているツイートの本文をすべて取得。そのツイートをpythonの文字列操作で「#」と半角スペースで囲まれている単語をリストに追加していく

ちなみにtweepyは調べれるツイートの数が限られているそうですが、ツイートのIDを操作したらそれよりもたくさん調べることができました。

それとステマや夜系のツイートは取得したくなかったので、検索の時点で省きました。

そしてCounterを使って、それぞれの単語がどれだけ出てきたかを調べる。

最後に可視化をしたかったので、WordCloudを使って画像にしてみました。

沖縄のハッシュタグ解析

なかなかいい感じにできましたが、ここで気づいたことは、「okinawa」や「沖縄」、「trip」、「旅行」などがり、検索語があってもあまり意味がないので、それらの単語を消したバージョンも作ってみました。

沖縄のハッシュタグ解析

結構いろんな単語がハッシュタグとしてつけられているようです。

「玉泉洞」や「ひめゆりの塔」、「ビーチ」、「おきなわワールド」わかるとして

「しむじょう」、「むーむー」、「バンドゥビキニ」など全く意味わからない単語もあります。

6月なので、「梅雨」や「rain」などがあったり、前に記事にも書いた6・23の慰霊の日があったので「ひめゆりの塔」が入ってきているのかなーって感じです。

気になったハッシュタグ

ちなみに知らない単語を調べてみました。

しむじょう

沖縄そばやじゅーしー、じーまみーなどで有名な首里にあるご飯やさんらしいです

むーむー

ハワイの女性の正装とされているゆったりしたドレスらしい。結婚式の正装とかに使われているのかなー

ムームー

Muumuus | iomi | Flickr

バンドゥビキニ

ビキニの種類らしい。ビキニはビキニじゃないんだ……

特徴としては、水着のブラトップの部分がチューブタイプになっている水着のことで、横長ラインを作ってくれてバストの形を気にしなくていい、らしいです。

男は調べないと一生出会うことのない単語ですね…..

バンドゥビキニ

Bikini | Image Courtesy: Maegan Tintari (www.flickr.com/phot… | Flickr

まとめ

 知らない単語がでてきて、新しく知れるから楽しい!

今回はWordCloudを使って可視化しましたが、グラフなどを使って得られたデータを解析してみたいです。

「インスタ自動いいね」と「メルカリ自動出品」はすでにつくったので、近いうちに記事に書きたいと思います。

自分の中では、Twitterよりインスタのほうが若い人がたくさんしていて、ハッシュタグをたくさんつける感覚なのでインスタのハッシュタグ解析もしてみたいと思います。

そんなとこで今日はこの辺で!

今日の締めの言葉は、

「退屈なことはPythonにやらせよう」です!

 

コメント

タイトルとURLをコピーしました