こんにちは。テクマトリックスの天久です。

データの視覚化を行うためのツール、Apache Superset(以下、Superset)を触る機会があったので、紹介します。同じ様なツールだとOSSではGrafanaの方が有名だと思いますが、Grafanaはどちらかというと監視系データの時系列表示に強く、SQLをゴリゴリ書いていくイメージです。それに比べてSupersetの方が柔軟にデータを表示でき、GUIで出来る事が多そうということでSupersetを試してみました。(実際はイメージ通りではなかった)

Apache Supersetとは?

Supersetはモダンなデータ探索、視覚化プラットフォーム、と公式に書いてありました。色々なデータを集めてグラフを使ってわかりやすく表示してくれるツールです。

元々はAirbnbの社員が始めたプロジェクトのようですが、現在はApacheプロジェクトに移管され、昨年からApacheのトッププロジェクトになりました。昨年は最も頻繁にコミットされたプロジェクトだったようです。(The Apache Software Foundation Blog)それだけ活発に活動しているのではないかと思います。

Docker Composeによるセットアップ

セットアップは公式のDocker Composeが用意されているので、試すのは非常に簡単です。もちろんドキュメントも用意されています。簡単に言うと、GitHubからSupersetのリポジトリをクローンして、docker-composeで起動するだけです。
https://superset.apache.org/docs/installation/installing-superset-using-docker-compose/#installing-superset-locally-using-docker-compose

公式のGitHubからプロジェクトをクローンします。

git clone https://github.com/apache/superset.git

クローンが完了したらSupersetのディレクトリに移動してDocker Composeのコマンドを実行します。

 cd superset
 docker-compose -f docker-compose-non-dev.yml pull
 docker-compose -f docker-compose-non-dev.yml up

これでセットアップは終了です。ブラウザーを起動してアクセスしてみます。デフォルトでは8088ポートを使って接続します。初期ユーザーはadmin/adminです。

初期設定ではサンプルデータが用意されており、ログインするとサンプルダッシュボードを見ることができます。いくつかサンプルがありますが、COVID-19 Vaccine Dashboardなんてタイムリーなダッシュボードが用意されており、Supersetの雰囲気を味わう事ができます。

まとめ

ひとまず、セットアップしてサンプルデータを見るというところまで完了しました。公式のDocker Composeが用意されているので、簡単に試すことができます。比較的新しいツールなので情報が少なく、公式ドキュメントも英語のものしか無いので若干戸惑いますが、直感的に操作出来そうなので安心して始められそうです。

次回は設定の変更やデータの投入などもう少し深く触っていこうと思います。どれだけ需要があるか分かりませんが、折を見て更新します。

最後に参考URLを貼っておきます。

公式:https://superset.apache.org/
GitHub:https://github.com/apache/superset

SupersetのSaaS:https://preset.io/
※ Presetという会社がSupersetのSaaSを提供しているようで、ドキュメントやYoutube動画など非常に参考になります。感謝!

By amahisa