「データサイエンティストは調査法を軽視している?」

twitterでもreplyしてしまったのだけれども。 言いたい主旨には同意ながらも、用途の違いかな、とも思う。 アドホック的な、何かしらのファインディングを見つけるための分析が目的であれば、その通りではあると思う。
また書いてあるように、ちゃんとしたアンケートって簡単ではない。 社会調査に求められる統計って覗いてみるとカナリ深かったり。

仕組みとしての分析や最適化

大規模データを対象として、レコメンデーションなり、何かしらの最適化計算なりと、仕組みとして動くものが必要な場面では、帰納的にパラメータを求める仕組みを担保しなくてはならない、という視線の違い。(演繹的なモデルを構築するよりも、varianceを小さくし続けるできる仕組みが大事。)

ブラックボックスとしての機械学習

…とはいえ、「ブラックボックス」として機械学習のモジュールを使っている人たちほど、統計的な取り扱いを軽視しているなぁと感じることは多いかも。
エンジニアからの入ってきたグループで、とりあえずLibraryを使って、何かやってみよう、みたいなグループ。

Web業界全般に感じる、とりあえず変数をざくっと入れてみよう、みたいな雰囲気も、こういうのも一因かなー、とか感じるわけで。