Lightdashを使ってみた ~データ可視化編

 
Zennに投稿したブログです。
Lightdashを使ってみた ~データ可視化編
OSS BIツールのLightdashをローカル環境で使ってみたので、実際にデータを可視化してみました。 Lightdashはdbtと接続して使用するBIツールで、 dbtで定義したmetricsを可視化することができる という特徴があります。昨今、dbtが流行してきていることを踏まえると、このようなdbtとシームレスに繋がるBIツールがどんどん出てくるのではと思っており、その筆頭として非常に注目しています。 今回の記事では、 実際にデータを可視化するところからの紹介となります。 Lightdashをセットアップして、GitHub上のdbtプロジェクトと連携するところまでは別の記事に書いたので、セットアップから始めたいという方はこちらをお読み頂ければと思います。 今回は、 自分のツイートに関するデータ を可視化に使いました。 自分のツイートデータは Twitter Developer PlatformのTwitter API から取得することができます。今回はとりあえず可視化を試すだけなので、dbtプロジェクト配下に持ってきていればどんなデータでもokです。 ツイートデータを少し整形して、 ・ツイートID ・文字数 ・引用ツイート数 ・返信数 ・いいね数 ・リツイート数 ・ツイート日 上記のカラムを持ったテーブルを使用したいと思います。 こんなテーブル dbtプロジェクトに上記のツイート情報のモデルを作成してありますが、 これだけだとLightdashで使用できるようにはなっていません。 Lightdash側から、dbt配下のTable, Dimension, Metricsを認識するためには、dbtでスキーマを定義する必要があります 。Lightdashではそのスキーマを基にして、データを読み込むという流れになります。 まず、dbtモデルとして定義されているテーブルを、Lightdashで使えるようにしていきます。 Lightdashで上述のツイート情報に関するテーブルを使用するには、dbt上でスキーマを定義する必要があります。 以下のように、一般的なスキーマ定義をdbt上で行うだけで、Lightdashですぐに使用することが可能です。 これで、Lightdashを見ると、 Mart twitterというTableが使用可能になっています。 また、テーブルを選択すると、 スキーマで定義したカラムがDimensionsとして定義されています。 !