データを活用するための3ステップ

ある日、データを活用して成果を出せと言われたら・・・

とりあえずデータを見て考える!みたいな行動を否定はしませんが、遠回りになる、最悪の場合遭難する可能性があります。

STEP1:あなたは最終的に何に貢献しようとしているのか

そもそも目的がない分析業務は存在しません。

「とりあえずデータがあるからなんか見てみてよ」と言われたら「あなたは材料を買ってから料理のメニューを考えますか?」と聞きましょう。

ここでは「ダイレクトメール(Email)の効果が下がっているから改善したい」という目的を仮置きしましょう。

張り切って、ダイレクトメールのデータを全て把握して、ユーザー情報を上から見ていく・・・そんなことをしていたら分析部門は消滅するでしょう。

まず、何が原因で下がっているのかを切り分け、問題の輪郭をはっきりさせる必要があります。

「ダイレクトメールの効果 = ダイレクトメール経由の受注額」としたときに、「受注額 = ダイレクトメールの送付数 × 開封率 × 開封後の購入率」と分解できます。

送付数は変わらなかったとして、開封率か、購入率の、どちらか・もしくはどちらも下がっていることになります。

ここでは、購入率が下がっているとします。

つまり、購入率の改善に貢献すれば、ダイレクトメールの効果を改善できることになります。

このように、何に貢献しようとしているのかをできるだけ明確に特定してから分析を開始する必要があります。

開封率・購入率、のデータを確認する工程はありますが、ここで主に求められるのはビジネス理解とロジカルシンキングなどの問題解決スキルです。

Pythonを覚えようが、nehanを操作できようが、このSTEP1ができなければ・もしくはできる人がチームにいなければ、無価値です。

STEP2:何を比較するのか

分析の本質はこのSTEP2です。なぜならば、分析を一言でいうと「比較すること」だからです。

「1945年の日本の男性比率は47%だった」これは分析でしょうか。否。1点のデータからは何もわかりません。ただそうだった、としか。

「1940年の日本の男性比率は50%、1945年は47%だった」これを見ると、1945年は第二次世界大戦終戦の年だったので、男性が多く戦死し、男性比率が減った、と考察できます。

ここから言えるのは、データは比較して初めて意味がある、ということです。

加えて、定量情報(比率が下がった)と定性情報(1945年は終戦年だった)を両軸で把握しないと分析が成立しません。

そして、ビジネスシーンではどちらかをおろそかにしがちです。

定性情報だけではただの勘。定量情報だけでは理由がわからない数値変動。「なんかわかりませんが下がってます。」なんで報告したら怒られるでしょう。

さて、ダイレクトメール経由購入率の改善に貢献するテーマに戻ります。

まず、ざっくばらんに購入率が下がった理由を考えてみましょう。

  1. 訴求内容が20,30代女性というメインターゲットに響かなくなっている?
  2. ライトユーザー向けの価格だが、彼らはちゃんと買っている?
  3. ユーザーの質が変化している?(外部要因?)

これらの仮説は、どうやったら証明できるのでしょうか。言い方を変えると、何を比較すれば分かるのでしょうか。

  1. 性別ごと、年代ごとの購入率を比較してみる
  2. ライトユーザーの購入率の現在と過去を比較してみる
  3. ダイレクトメールではなく、サービス内の購買状況の現在と過去を比較してみる

何を比較するのか、で求められるのは仮説思考です。

しかし、仮説は0から生まれるものではありません。

例えば、

  • ユーザーはなぜこのサービスで購買行動をするのか?
  • 競合サービスとの差は?
  • マクロ経済から見るユーザーのお財布事情は?

などの、様々な情報をインプットし、掛け合わせたりして生まれるものです。

仮説思考は考え方でしかなく、本質的に必要なのはインプットの量、と考えます。

STEP3:どう比較するのか

比較する方向性が決まり、どう比較するのか、を考えます。

  1. 性別ごと、年代ごとの購入率を比較してみる
    • 性別ごとの購入率を出し、棒グラフで比較する
    • 年代は、会員数のボリュームを見て、10歳未満、10代、20代、30代、30代、40代、50代、60以上で切る
  2. ライトユーザーの購入率の現在と過去を比較してみる
    • ライトユーザーは、RFMを定義してクラスタリング、クラスタの情報を元にしきい値を定義する
  3. ダイレクトメールではなく、サービス内の購買状況の現在と過去を比較してみる
    • 購入率・一人あたり購入単価を、時系列推移を折れ線グラフで比較する
    • 高額商品・低価格商品の売上シェアを時系列推移を、100%積み上げ棒グラフで比較する
    • ダイレクトメール配信対象者のカテゴリごと購入傾向差分を決定木で分析する

考えれば色々な比較方法を考えることができますが、ここで初めて分析手法と呼ばれるものが役に立ちます。

また、高度な分析手法でなくとも、シンプルなセグメント間比較も大きな威力を発揮します。

最後に

世の中はAIブームですが、AIに利用されている技術は、STEP3で述べたような比較するための手段でしかありません。

AIありきのデータ活用は、いきなりSTEP3を語るようなものであり、それが危険であることはここまで読んでいただけた方にはご理解いただけたと思います。

まぁそんなことを言ってしまえば、分析ツールnehanもSTEP3を実現するためのツールなんですが。

しかしながら、データを活用する上では、

  • STEP2で少し触れたような現状の把握
  • STEP3で書いたような比較軸の試行錯誤や分析手法の適用
  • それらを確認するための可視化

といった様々な作業が必要で、それぞれに対して専門のスキルは存在します。

2020年現在のベーシックなスキルセットは、SQLが書ける+Pythonが書ける+BIツールが使える、であると感じていますが、それがそのまま分析人材の不足の理由になっています。

これらのスキルセットは、STEP3を実現するためのものでしかありませんが、習得難易度の高さ故、人材の価格も高止まりしています。

データ活用を成功させるためには、STEP1,2を重視すべきであり、STEP3は最低限のコストで実現すべきと考えます。

分析ツールnehanは、データ活用を成功させるためのツールとして、今後も進化を続けていきますので、皆様よろしくお願いいたします。