2013-05-01から1ヶ月間の記事一覧

大規模データの分析のROIとビジネス上の課題

大規模データに対するスポットでの分析が(ビジネスとしては)難しい背景。大規模データを蓄積するためには、インフラや人などへの投資が必要。 ROI観点で考えると、「コスト」が増えた分だけ、より高い「リターン」を出さなければROIは悪化する。 しかし、…

「データサイエンティストは調査法を軽視している?」

データサイエンティストは調査法を軽視している? - Togetter twitterでもreplyしてしまったのだけれども。 言いたい主旨には同意ながらも、用途の違いかな、とも思う。 アドホック的な、何かしらのファインディングを見つけるための分析が目的であれば、そ…

SQLでロジスティック回帰を実装するTips

SQLでロジスティック回帰を実装するTipsを発見。 Deep Data Mining Blog: Logistic Regression Model Implemented in SQL SQLしか変更できない本番環境という背景のため、decode()とnvl()を用いてロジスティック回帰を実装、とのこと。 スコアリングの実装の…

経営工学と「データサイエンティスト」の育成

先日、某学会で経営工学の学生をしていた頃の先生と、10年近くぶりにバッタリと再会をし。 そこでちょくちょくと話をしていて、経営工学こそデータサイエンティスト育成に近いよね、といった話が出てきたので。 経営工学とは 経営工学って、マイナーだったり…

Topic ModelとかLDAとかのメモ書き。

ちょっと野暮用があり、Topic Modelの実験。 説明とか 私のブックマーク: Latent Topic Model (潜在的トピックモデル) 人工知能学会の私のブックマークから。 latent Dirichlet allocation - 機械学習の「朱鷺の杜Wiki」 LDAについて。 (pdf)Probabilistic t…

データ分析者不足について雑感。

ここ数年、最近は広義の意味でのデータ分析全体が熱く、分析者に対する需要も高くなっているけれども、正直、ここまでの今の状態は一過性なのかな、と。俯瞰してみるならば、企業でのデータ分析活用のためのバリューチェーンのなかで、現在は属人的で高付加…