PythonとSQLでIMDB高評価映画を深堀り分析!インタラクティブな可視化も実現
PythonとSQLを使って、IMDBの高評価映画データセットを徹底的に分析してみませんか? このプロジェクトでは、DuckDBとPythonを活用し、250本のトップレート映画に関するSQLクエリを実行します。分析結果は`itables`を用いてインタラクティブなHTMLテーブルとして表示され、Quartoで記述された`notebook.qmd`ファイルにまとめられます。
2025年4月30日 著者 gpenessot
PythonとSQLでIMDB高評価映画を深堀り分析!インタラクティブな可視化も実現
PythonとSQLを使って、IMDBの高評価映画データセットを徹底的に分析してみませんか? このプロジェクトでは、DuckDBとPythonを活用し、250本のトップレート映画に関するSQLクエリを実行します。分析結果はitables
を用いてインタラクティブなHTMLテーブルとして表示され、Quartoで記述されたnotebook.qmd
ファイルにまとめられます。
プロジェクトの魅力
- SQLでのデータ分析: SQLクエリを用いて映画データを効率的に分析できます。
- インタラクティブな可視化:
itables
で分析結果をインタラクティブなHTMLテーブルとして表示。さまざまな角度からデータ探索が可能です。 - DuckDBによる高速処理: 軽量で高速なDuckDBを活用し、大規模データセットも快適に処理できます。
手軽な導入方法
-
リポジトリをクローン:
git clone https://github.com/gpenessot/imdb-sql-analysis.git cd imdb-sql-analysis
-
仮想環境の構築と依存関係のインストール:
uv venv source .venv/bin/activate # Windowsの場合は .venv\Scripts\activate uv pip install -r pyproject.toml
簡単な使い方
-
HTMLとしてレンダリング:
quarto render notebook.qmd
-
Jupyterでインタラクティブに実行:
quarto preview notebook.qmd
必要なデータセット
data/
フォルダ内にmovies.db
という名前のSQLiteデータベースを配置してください。データベースはmovies
テーブルを含んでいる必要があり、以下のカラムを持つ必要があります。
title
director
year
rating
genres
runtime
country
language
imdb_score
imdb_votes
metacritic_score
映画のデータ分析を始めよう!
このプロジェクトを通して、PythonとSQLを使った映画分析のエキスパートを目指しましょう! 高評価映画の秘密を解き明かし、データに基づいたインサイトを発見してください。