【真夏のアイスNo.1】アイス売れ行きの分析の裏に隠された意図を想像してしまう

Posted on by

以前このブログでも触れた、家計簿アプリのデータ分析シリーズの最新号で、アイスの人気ランキングを出していました。

真夏のアイスNo.1の座はどれに!? 購買データ分析で見る「アイス28種“総選挙”」 (1/2)

「データサイエンティストによる分析」
というほどのものではなくて、単に集計しただけの結果なのが残念なところで、こんな記事もありました。

データサイエンティストって名乗るのが恥ずかしくない人は要注意!!

Twitterでも否定的な意見は多いのですが、私には、
「意図的に軽い分析結果をまとめている」
ように思えます。

家計簿のデータなんていう、超有用なデータが手に入ったら、分析したいことなんてキリがないくらいたくさんあると思うのですが、例えば、
家族構成の推定
は是非やってみたいことの一つではないでしょうか?

例えば、子供がいるかどうか、いるとしたらその子供は何歳なのか、
と考えたとき、
赤ちゃん用のおむつを買っているとか、
ランドセルを買ったとか、
子供の年齢を推定する要素はたくさんあります。
ですが、1つ1つそういったものを指定するだけではない、
精度の高い分析手法をあれこれ試しているとしたらどうでしょう?
こういう分析手法の記事だったら面白そうなのでぜひ読んでみたいですね。

で、もしそのような分析結果がすでにあるならば、
今回のアイスのランキングと結び付けて、
「未就学児の親はピノをよく買っている」
とか、そう言った結論も出てきますよね。

では、なぜそのような面白い分析結果を敢えて出さないのか?

私は、
家計簿アプリを使っている人の気持ちを考えて
のことだと思っています。

こんな風に、
データ分析で家族構成を推定しています
なんて言ってしまったら、
「子供の年齢なんて入力した覚えないのに・・・」
と、気味悪く思ってしまう人も出てきます。

なので、このように広く一般の人を対象にした記事では、
近所の商店が「今月はアイスの実がたくさん売れたなぁ」
と、売れた数を数えるのと、同じ程度のことしかしていないと強調することが重要なのです。

これと関連するのが、以下の記事です。

ビッグデータは「あなたに興味はない」–(1)匿名提供を考える

SUICA のデータ販売が中止に追い込まれたこともあり、
いかに一般の人に「個人情報収集の抵抗感をなくさせるか」は、データ収集事業者の課題です。

「あなた個人には何の興味もない」

を強調したいんですね。

この家計簿アプリReceRecoは、ユーザが使い始める際に、
匿名化したデータを第三者に販売すること も明記した上で、
きちんと同意を取っています(「利用規約に書いてあります」ではなく、大きく明示的に表示しています)。
そういう点では素晴らしいのですが、実際のところどういう分析をしているのかは、
「単なる集計レベルのことしかしていませんよ」
ではなくて、本当の所をもうちょっとはっきりと開示してくれた方が、
信頼度も増すのではないかなと、個人的には思うのですが。

家計簿のデータに限らず、
Tポイントのデータもそうですが、
自分のデータがどう分析されて使われているのかは、一般の人には中々わかりづらいことだと思うので、
どんな風に使っているか本当のところを公開して、
「抵抗を感じない人だけ使ってください」
という、真摯な態度が事業者には求められているのではないか、というのが私の考えです。

Category: 未分類