こんにちは。テクマトリックスの天久です。
データの視覚化を行うためのツール、Apache Superset(以下、Superset)を触る機会があったので、紹介します。同じ様なツールだとOSSではGrafanaの方が有名だと思いますが、Grafanaはどちらかというと監視系データの時系列表示に強く、SQLをゴリゴリ書いていくイメージです。それに比べてSupersetの方が柔軟にデータを表示でき、GUIで出来る事が多そうということでSupersetを試してみました。(実際はイメージ通りではなかった)
Apache Supersetとは?
Supersetはモダンなデータ探索、視覚化プラットフォーム、と公式に書いてありました。色々なデータを集めてグラフを使ってわかりやすく表示してくれるツールです。
元々はAirbnbの社員が始めたプロジェクトのようですが、現在はApacheプロジェクトに移管され、昨年からApacheのトッププロジェクトになりました。昨年は最も頻繁にコミットされたプロジェクトだったようです。(The Apache Software Foundation Blog)それだけ活発に活動しているのではないかと思います。
Docker Composeによるセットアップ
セットアップは公式のDocker Composeが用意されているので、試すのは非常に簡単です。もちろんドキュメントも用意されています。簡単に言うと、GitHubからSupersetのリポジトリをクローンして、docker-composeで起動するだけです。
https://superset.apache.org/docs/installation/installing-superset-using-docker-compose/#installing-superset-locally-using-docker-compose
公式のGitHubからプロジェクトをクローンします。
git clone https://github.com/apache/superset.git
クローンが完了したらSupersetのディレクトリに移動してDocker Composeのコマンドを実行します。
cd superset
docker-compose -f docker-compose-non-dev.yml pull
docker-compose -f docker-compose-non-dev.yml up
これでセットアップは終了です。ブラウザーを起動してアクセスしてみます。デフォルトでは8088ポートを使って接続します。初期ユーザーはadmin/adminです。
初期設定ではサンプルデータが用意されており、ログインするとサンプルダッシュボードを見ることができます。いくつかサンプルがありますが、COVID-19 Vaccine Dashboardなんてタイムリーなダッシュボードが用意されており、Supersetの雰囲気を味わう事ができます。
まとめ
ひとまず、セットアップしてサンプルデータを見るというところまで完了しました。公式のDocker Composeが用意されているので、簡単に試すことができます。比較的新しいツールなので情報が少なく、公式ドキュメントも英語のものしか無いので若干戸惑いますが、直感的に操作出来そうなので安心して始められそうです。
次回は設定の変更やデータの投入などもう少し深く触っていこうと思います。どれだけ需要があるか分かりませんが、折を見て更新します。
最後に参考URLを貼っておきます。
公式:https://superset.apache.org/
GitHub:https://github.com/apache/superset
SupersetのSaaS:https://preset.io/
※ Presetという会社がSupersetのSaaSを提供しているようで、ドキュメントやYoutube動画など非常に参考になります。感謝!