周辺情報から推測をする、というデータ分析の使われ方。

友人から聞いて知ったニュース。

404 - Not Found:テレビ東京
(略) また今回は時差があり、深夜の観戦も多く、常盤薬品工業の眠気覚まし飲料「眠眠打破」は二桁で売り上げが伸びているといいます。

ポイントカード類の購買データの分析で、「観戦前の深夜に購買した人」と「次の日の朝、昼に購入をした人」の層別で見てみたら特徴に差がありそう、とふと思ったり。
前者はスポーツ観戦大好きな層で、後者は、、うーん、ネーミング悩ましいけれど、そういう層。 思いつきで、半ば冗談ですけれど。

間接的なデータからの推測

とはいえ、最近、大規模データの蓄積によるデータ分析に関するニュースも増え、またプライバシーついても話題に上ることが増えましたが、これら分析では「直接それを説明するデータ」が無くても、「間接的な周辺の情報」を用いることで、対象によってはかなりの確度で推定をすることも可能だったりします。

上記の思いつき例では、商品の購買動向からスポーツ観戦派生ビジネスへの消費性向を示すデータが推定される、といった様な。
あまり具体的な話はアレですが、実際の例としては金融機関みたいな資産残高で勝負というビジネスあたりなんかでは、ただのTransactionデータからその人の資産総額を推定する、なんていうのも。

プライバシーの問題

一つ一つは大したこと無いデータであっても、それらが時系列の集まりとなることで意味を持ち得るという、規模が価値を生むのです。
現状ではこの様な用いられ方がされているという認識は消費者にはないですが、いつかそれに対するプライバシー云々という話が大きくなるのかも、、という予感をしつつ。