組織にデータビジュアライゼーションの文化を浸透させる

こんにちは、AIチームの友松です。
本日はタイトルの通り、「組織にデータビジュアライゼーションの文化を浸透させる」までに行なったことをご紹介します。実際にここに至るまでは1年ほどの試行錯誤がありましたので失敗も含めて紹介させていただければと思います。また、今回紹介する例はあくまで一例であって全ての組織に通じるものでもないと思っていますのでご承知ください。

AI Shiftで利用しているデータビジュアライゼーションツール

AI ShiftではデータビジュアライゼーションのツールとしてTableauを利用しています。TableauはExcel, CSVのようなファイルや、Google Spread Sheet, MySQL, BigQuery, Redshiftなどのデータベース/サーバーと接続することができ、直感的に可視化を行うことができます。Tableauは自分自身学生の頃から使用していて非常に愛着のあるツールです。(学生はアカデミックプログラムで無料で使えるので非常におすすめです)

Step1. 自分たちのデータに関心を持ってもらう

まず第1ステップとして自分たちのデータに関心を持ってもらうことが重要であると考えます。AI Shiftではチャットボットに関連する様々な指標や分析用の可視化がTableauによって行われています。データサイエンティストの目線で常に見て欲しいデータやチャットボットの分析に使うための可視化を数多く行いました。色々な視点でデータの可視化を行っていくとメンバーの中から「こんなデータを見れないか」、「見せ方をこういう風に変えられないか」の様な要望が少しずつ出てくる様になります。この点に関してはAI Shiftではすんなり行ったのですが、ここをクリアするのに苦労している話もよく耳にします。

Step2. データ可視化依頼が増加する

Step1でデータに興味を持ってもらった先にあるのが「もっと○○」のように見たい項目が増えたり、「このクライアントだったら」と行った様な個別の分析を行なっていきたい状況が起こります。

ここで問題になってくるのは、これらの声に対して自分たちでデータをとってくることができない場合「依頼」という形になってエンジニアに降ってくる形となります。この状態が続いてしまうと本来のデータサイエンティストとしての職務を全うできなくなってしまうくらい依頼が重なり、「SQLクエリ発行職人」と化してしまいます。AI Shiftでは一時期、業務時間の半分を可視化依頼に使っている時期もありました。

もう一つ問題としてあったのは、すでにTableauで可視化されているデータをダウンロードしてExcelで再加工を行なっているというパターンです。スポットの可視化であればまだ良いですが、クライアントにレポートとして提出するために毎週同じ作業をやっていたりすることもありました。

「データを見たい人が自分でデータにアクセスでき自在に可視化できる状態」こそが健全な状態であると考え、データの民主化というのを推し進めて行きたいと思ったのが取り組みを始めたきっかけでした。

ただ、この依頼が増加する期間も振り返ってみると必要な時期だったと感じています。この時期に根気よく可視化依頼に答えた(もちろん前段にやる/やらないの判断はありますが)ことでビジネスサイドに自分たちのデータでどんなことが見れるのかというのを自分ごと化できる期間になったと思います。

Step3. Tableauを体系立てて勉強

1つ目の取り組みとして、Tableauの書籍をもとに教科書的な例題を解くことを体系的にやりました。重要なのは短い期間に詰め込んでやることです。最初のうちは業務の合間に行なっていたため週に1回1時間程度でやっていたのですが、人間1週間経つと忘れてしまうもので、毎週思い出すことにかなりの時間を要してしまいまったため、あるタイミングで詰め込んで学習を行いました。

ここでの失敗は体系的に学んだものを実際のプロダクトのデータで実践するまでに間が空いてしまったことです。例題から実データを扱うところにはやはりSQLを書かなければいけないという大きな壁がありました。実現したい事象ごとにSQLをこちらで準備するのは非常に大変ですし、体系的に学んでから実データで手を動かすまでに時間が空いてしまったことでそれまでに学んだことも抜けてしまいました。この時間をいかに減らして自分で手を動かすまで持っていけるかによってその後の定着に大きく影響すると思います。

Step4. 汎用テーブルの作成

Step3での反省を生かし汎用テーブルを作成しました。汎用テーブルというのはログとして存在する複数のテーブルを結合するSQLによって作られたテーブルで、これを参照したらTableauで何でも可視化出来るテーブルになっています。このテーブルをTableauのデータソースとしてパブリッシュしました。データを可視化しようとするメンバーはこのデータにアクセスすれば基本的には全てのデータにアクセスできるため、このデータを完全に理解すればほぼなんでも可視化できる状態になります。このSQLはそれぞれのやりたいことに対してToo muchなデータなのですが、Tableauをマスターするための道としては非常に有効な手段でした。

この取り組みは非常にワークしました。
メンバーはTablaeuの使い方 + 1つのデータソースの仕様を覚えるだけであらゆる可視化ができます。
自分自身が教えるときも、このデータはどんなSQLでできてたっけということをいちいち考えなくても常に同じテーブルを参照しているので楽です。

その後

現在はTableauを使えるようになったビジネスメンバーが新規メンバーに対してTableau勉強会が行われ良い循環が生まれました。また、依頼数に関しても現在ほぼ0になっており、たまにあるのは、こういう数値出したいけどどうやれば実現できるのかという相談と汎用テーブルに新たな項目を追加することです。

まとめ

今回紹介したのはあくまで今の組織でうまくいった例であり、必ず成功する訳ではありませんが以下のことが重要であると考えています。

  1. 可視化の重要性を認識してもらう
  2. 自分たちのデータに興味を持ってもらう
  3. データビジュアライゼーションツールの使い方を徹底的に覚えてもらうための支援を行う
  4. 自分たちのデータで可視化を行なってもらう
  5. 気軽にデータにアクセスできる仕組みを作る

学生時代に自分が痛感したことなのですが、その時必要ないと思っていたことが数年後にすごく重要なことに気づき、勉強し直すようなことが幾度となくありました。可視化を普及する立場としてはこれが起こらない様に順序設計をしっかりする必要があると思いました。

また、ここまで来るまでに非常に長い道のりでした。
自分たちとしては2までは既に達成されていたところから始まっているので実際に行なったのは3からになりますが、この一連の流れが一度出来てしまえば、あとは自分たちで試行錯誤のプロセスを回してもらえるのでその後は困ったところを補助すれば良い状態になります。1年という長い時間がかかりましたが、この1年で出来たことは非常に大きかったと感じています。何よりもデータ分析のPDCAを回せる人が多くいることは組織にとって非常に強みになっていると思います。