概要

pytrends ライブラリの get_historical_interest() 関数を使用すると、指定した期間内における特定の検索語の時間別関心度データを取得できます。これは、検索語の人気度をより細かい粒度で理解するのに役立ち、日次や週次のデータでは見えないトレンドを特定するのにも有用です。

このチュートリアルでは、以下の内容を取り上げます:

  1. 必要なライブラリのインポート
  2. pytrends リクエストのセットアップ
  3. 過去の時間別関心度データの取得
  4. 結果の可視化

インストール

Pytrendsをインストールするには、pipを使用するだけです:

pip install matplotlib

過去の時間別関心度データの取得

まず、必要なライブラリをインポートし、pytrends リクエストをセットアップします。

from pytrends.request import TrendReq
import pandas as pd
import matplotlib.pyplot as plt

# Set up pytrends request
pytrends = TrendReq(hl='en-US', tz=360)

次に、get_historical_interest() 関数を使用して、検索語、期間、その他のパラメータを指定します。

keywords = ['Python', 'JavaScript']

# Retrieve hourly interest data
hourly_interest = pytrends.get_historical_interest(keywords, year_start=2023, month_start=3, day_start=1, hour_start=0, year_end=2023, month_end=3, day_end=2, hour_end=0, cat=0, geo='', gprop='', sleep=0)

これにより、2023年3月1日から3月2日までの「Python」と「JavaScript」という検索語に対する時間別関心度データを含むDataFrameが返されます。

結果の可視化

それでは、シンプルな折れ線グラフを使用して、時間別関心度データを可視化してみましょう。

# Plot the hourly interest data
plt.figure(figsize=(12, 6))
plt.plot(hourly_interest.index, hourly_interest['Python'], label='Python')
plt.plot(hourly_interest.index, hourly_interest['JavaScript'], label='JavaScript')

plt.xlabel('Hour')
plt.ylabel('Interest')
plt.title('Hourly Interest for Python and JavaScript')
plt.legend()
plt.show()

このグラフは、指定した期間における「Python」と「JavaScript」両方の時間別関心度を示しており、人気度を比較してトレンドを特定することができます。

結論

この記事では、pytrends ライブラリの get_historical_interest() 関数を使用して、Googleトレンドから過去の時間別関心度データを取得する方法を紹介しました。このデータを掘り下げることで、検索語の人気度に関する貴重なインサイトを得て、消費者行動をより深く理解できます。このチュートリアルでは、pytrends リクエストのセットアップから結果の可視化まで、時間別関心度データを収集・分析するプロセスを取り上げました。


NOTE : pytrends は非公式APIを使用しています。問題がある場合は こちら をご利用ください。

SAMPLE CODE : https://github.com/hobbyworker/google-trend-for-python