2025年4月30日 著者 gpenessot
PythonとSQLでIMDB高評価映画を深堀り分析!インタラクティブな可視化も実現
PythonとSQLを使って、IMDBの高評価映画データセットを徹底的に分析してみませんか? このプロジェクトでは、DuckDBとPythonを活用し、250本のトップレート映画に関するSQLクエリを実行します。分析結果はitables
を用いてインタラクティブなHTMLテーブルとして表示され、Quartoで記述されたnotebook.qmd
ファイルにまとめられます。
プロジェクトの魅力
- SQLでのデータ分析: SQLクエリを用いて映画データを効率的に分析できます。
- インタラクティブな可視化:
itables
で分析結果をインタラクティブなHTMLテーブルとして表示。さまざまな角度からデータ探索が可能です。 - DuckDBによる高速処理: 軽量で高速なDuckDBを活用し、大規模データセットも快適に処理できます。
手軽な導入方法
-
リポジトリをクローン:
-
仮想環境の構築と依存関係のインストール:
簡単な使い方
-
HTMLとしてレンダリング:
-
Jupyterでインタラクティブに実行:
必要なデータセット
data/
フォルダ内にmovies.db
という名前のSQLiteデータベースを配置してください。データベースはmovies
テーブルを含んでいる必要があり、以下のカラムを持つ必要があります。
title
director
year
rating
genres
runtime
country
language
imdb_score
imdb_votes
metacritic_score
映画のデータ分析を始めよう!
このプロジェクトを通して、PythonとSQLを使った映画分析のエキスパートを目指しましょう! 高評価映画の秘密を解き明かし、データに基づいたインサイトを発見してください。