2025年4月30日 著者 gpenessot
PythonとDuckDBで実現!IMDB高評価映画250作品の魅力的なSQL分析
映画好き必見!Python、DuckDB、そしてQuartoを活用して、IMDB高評価映画250作品のデータを深掘り分析するプロジェクトをご紹介します。インタラクティブなテーブル表示で、映画の新たな一面を発見しましょう。SQLクエリを使って、あなただけの映画ランキングを作成することも可能です。
なぜこのプロジェクトが面白いのか?
- SQLで映画データを自由自在に分析: DuckDBを使用し、SQLクエリで映画データ(タイトル、監督、公開年、評価など)を分析できます。
- インタラクティブな結果表示: 分析結果は、itablesでインタラクティブなHTMLテーブルとして表示されます。
- PythonとQuartoによるレポート作成: 分析レポートはQuartoで記述されています。Jupyter Notebookでインタラクティブに操作可能。
- ロングテールキーワード: IMDB映画データベース 分析、Python SQL 映画分析
インストールは簡単!
- リポジトリをクローンします。
- 仮想環境を作成し、必要なパッケージをインストールします。
使い方は?
Quarto notebookをHTMLとしてレンダリングするには:
Jupyterでインタラクティブに開くには:
必要なデータセット
SQLiteデータベースmovies.db
をdata/
フォルダ内に配置してください。movies
テーブルは以下のカラムを持つ必要があります。
- title
- director
- year
- rating
- genres
- runtime
- country
- language
- imdb_score
- imdb_votes
- metacritic_score
ライセンス
本プロジェクトはMIT Licenseで提供されています。
早速始めて、あなただけの映画分析レポートを作成しませんか? データ分析を通して、今までとは違う映画の楽しみ方を発見できるはずです! SQLのスキルアップにも最適です。