概要
pytrends ライブラリの get_historical_interest() 関数を使用すると、指定した期間内における特定の検索語の時間別関心度データを取得できます。これは、検索語の人気度をより細かい粒度で理解するのに役立ち、日次や週次のデータでは見えないトレンドを特定するのにも有用です。
このチュートリアルでは、以下の内容を取り上げます:
- 必要なライブラリのインポート
pytrendsリクエストのセットアップ- 過去の時間別関心度データの取得
- 結果の可視化
インストール
Pytrendsをインストールするには、pipを使用するだけです:
pip install matplotlib
過去の時間別関心度データの取得
まず、必要なライブラリをインポートし、pytrends リクエストをセットアップします。
from pytrends.request import TrendReq
import pandas as pd
import matplotlib.pyplot as plt
# Set up pytrends request
pytrends = TrendReq(hl='en-US', tz=360)
次に、get_historical_interest() 関数を使用して、検索語、期間、その他のパラメータを指定します。
keywords = ['Python', 'JavaScript']
# Retrieve hourly interest data
hourly_interest = pytrends.get_historical_interest(keywords, year_start=2023, month_start=3, day_start=1, hour_start=0, year_end=2023, month_end=3, day_end=2, hour_end=0, cat=0, geo='', gprop='', sleep=0)
これにより、2023年3月1日から3月2日までの「Python」と「JavaScript」という検索語に対する時間別関心度データを含むDataFrameが返されます。
結果の可視化
それでは、シンプルな折れ線グラフを使用して、時間別関心度データを可視化してみましょう。
# Plot the hourly interest data
plt.figure(figsize=(12, 6))
plt.plot(hourly_interest.index, hourly_interest['Python'], label='Python')
plt.plot(hourly_interest.index, hourly_interest['JavaScript'], label='JavaScript')
plt.xlabel('Hour')
plt.ylabel('Interest')
plt.title('Hourly Interest for Python and JavaScript')
plt.legend()
plt.show()
このグラフは、指定した期間における「Python」と「JavaScript」両方の時間別関心度を示しており、人気度を比較してトレンドを特定することができます。
結論
この記事では、pytrends ライブラリの get_historical_interest() 関数を使用して、Googleトレンドから過去の時間別関心度データを取得する方法を紹介しました。このデータを掘り下げることで、検索語の人気度に関する貴重なインサイトを得て、消費者行動をより深く理解できます。このチュートリアルでは、pytrends リクエストのセットアップから結果の可視化まで、時間別関心度データを収集・分析するプロセスを取り上げました。
NOTE : pytrends は非公式APIを使用しています。問題がある場合は こちら をご利用ください。
SAMPLE CODE : https://github.com/hobbyworker/google-trend-for-python