ご無沙汰してます。(多分このサイト、クローラーしか見てないと思うけど)
Tableau(タブロー)というデータ分析ツールをちょっと触ってみました。
いわゆるBIツール(企業内に溜まった大量データを分析してくれるやつ)を触るのは初めてです。
試用版は製品のフル機能を14日間使えます。
実際にいじってみた画面など、単にスクショ撮っておいたところで見返す頃には浦島太郎。
ピクチャフォルダが玉手箱化するのが目に見えているので、一連の流れを記事にしておこうという魂胆です。
■食わせたデータ
タグにつけたバンドのライブとセットリスト情報13年分。
ライブ本数240本ほど、セットリストの曲数としては4,100曲くらい。
有志によるセトリ収集サイトからファンwikiから個人ブログからSNSまで駆け巡って集めました。
こんな感じのExcelの表形式にまとめてあります。
■実際に食わせてみた
とりあえず公式サイトの案内通りにユーザ登録してTableauをダウンロードして再起動してメアド登録して試用します。
以下、画像がすんごいでっかくてすいません。
Tableauを立ち上げると「データ!データください!!」と言わんばかりの画面が出るのでExcelを連携します。
シート別にデータを読み込んでくれるので、分析したいシートを画面の指示通りにドラッグします。
複数シートをドラッグしてAccessのリレーションシップみたいなこともできるっぽいけど、
セトリの曲順列それぞれと楽曲一覧をうまく紐づける方法がわからなかったのでまずは1シートだけでシンプルに触ってみる。
とりあえず開催都道府県をベースに、楽曲の演奏数を出してみたいとこなのだけど......
セトリの曲順がそれぞれ列になってるからまとめて紐づけができない。
これはこれで、うまく集計すれば「どういう演奏順がどの地域で多いか」を見られそうだけど
ライブツアーは固定の演奏曲と変動曲が混ざるから特に面白いデータにはならなさそうな気がする。
というわけで複数列のデータをひとまとめに集計する方法をググりました。
データソースタブで読み込んだシートの、まとめたい列をまとめて選択してピボットでいけるらしいです。
いけました。ワークシートに戻って列をピボットのフィールド値に変えてみると......
あっ、これこれ。あとはabcが数字になればバッチリですね。
abcを数字に変更するのは、色々いじってたら偶然できたレベルで成功しました。
列ラベルに使った ピボットのフィールド値 をマークという枠に持ってきて、ディメンションからカウントに変更する。
(この操作がどういう意味なのか正直よくわかってない)
で、名前と色の変わったラベルをシート側にドラッグすると......
DE・KI・TA!!!
画面右上の表示形式から色々なグラフが選べます。
シートにどういった種類のデータを使ったかで、見られるグラフが変わるようです。連携技のアンロックみたい。
そんなこんなで都道府県別の楽曲演奏数が可視化できました。
画像は(ファンには)わかりやすく、アコースティックアレンジ曲の演奏数のみフィルタリングしたリストです。
基本都内ライブしか行かないけどセンラバのアコステ聴いたことある気がするんだよなぁ......
おおもとのデータの精度があやしいなぁ......
そんなぼやきはさておき。
こういったツールの使い方やお作法はサッパリわからない私ですが、
優れたGUIのおかげか一応数時間でそれらしい集計表を作るまでに至りました。
勿論できあがったものも操作も「はじめのい~っぽ!」ぐらいのものですが、
初見の素人でもとっつきやすい、というのは強みだと思います。
せっかく14日間使えるのでもう少し色々可視化してみたいですね。
そのうえで別のBIツールで同じような表を作ってみて、使い勝手を比べられたらいいなと思います。
では今日はここまで。
コメント
最新を表示する
NG表示方式
NGID一覧