2012-01-01から1年間の記事一覧

「予測ビジネスで儲ける人々」

予測ビジネスで儲ける人びと―すべての予測は予測はずれに終わる作者: ウィリアムシャーデン,William A. Sherden,森孝恵出版社/メーカー: ダイヤモンド社発売日: 1999/05メディア: 単行本購入: 3人 クリック: 8回この商品を含むブログ (4件) を見る昔の本なの…

アメリカ大統領選とか、データ分析とか。

大統領選でニューヨークタイムズのネイト・シルバーの数理モデル予測が全50州で的中―政治専門家はもはや不要? | TechCrunch Japan アメリカの大統領選の予測において、全50州で予測を的中させたというお話。 この話然り、マネーボールにおける話にしても、…

RからC++を呼び出して計算の高速化

RからCのコードを呼び出す方法としては、SharedLibraryを呼び出す方法が標準的なのですが、それ以外の方法について。Rcpp 0.10.0 が1週間ほど前にCRANに登録されたようで、このキッカケでRcpp自体を知ったさっきです。 これを使うと、C++のコードをsourceCpp…

EC2でのクラスター構築と並列計算

EC2でいざクラスターを構築して計算をしようとしても、以外と環境の構築面で足を引っ張られがち。 何かしら無いかと探してみたら、StartClusterというtoolkitを発見。 STAR: Cluster - Home StarCluster has been designed to automate and simplify the pro…

GPGPUの入門用のリソース。

GPU(というかCUDA)の使い方に関して Programming Massively Parallel Processors with CUDA - Stanford の無料コンテンツを iTunes で無料ダウンロード nVIDIAの研究所の人のStanfordでの講義の動画。内容は学生向けと言うだけあり、分かりやすい。(英語も…

GPUでレコメンデーションの計算の高速化

実際のところ、リアルタイムでレコメンデーションを走らせるためには、速い計算機が必要である。 計算量を食わない簡略化したロジックを動かすとか、計算機をクラスタ化して環境を構築する、などのアプローチもあるが、GPUを使って計算を高速化するというア…

"Social Network Analysis"のフリーの講義とフリーのテキストブック。

courseraの"Social Network Analysis"のクラス。 無料でこれだけの内容が提供されていて、それをどこでも見ることが出来るのだから、本当に素晴らしい時代なのだと思う。 Social Network Analysis https://www.coursera.org/course/sna Lada Adamic - This c…

「2020年にアツいビジネス」と個人の差別化

配信されていた記事で、面白そうなものを発見。10 Businesses That Will Boom in 2020 - Yahoo! Finance政府統計(The government's Bureau of Labor Statistics (BLS))などのリサーチを元にまとめた、2020年に活発になっているであろうビジネスのフィールド…

Rでbig dataのハンドリングと並列計算

Online resources for handling big data and parallel computing in R | blog.RDataMining.com Compared with many other programming languages, such as C/C++ and Java, R is less efficient and consumes much more memory. Fortunately, there are som…

ビジネス側でのデータ分析についての本

ビジネス側で道具としてデータ分析を使いたい人のための良い本が少ないように感じる。日本語で出ているデータ分析絡みの本を分類すると、理論書やRで機械学習的な本も最近はあるけれど、そこから一歩離れると、Accessでできるデータ分析入門的な本となり、ち…

iris

機械学習、統計周辺の人は大好きなirisデータセット。 原典はFisherと聞いていたけれど、探してみたら論文のPDFが出てきたよ。 Fisher, R. A. (1936) The use of multiple measurements in taxonomic problems. Annals of Eugenics, 7, Part II, 179–188. Ad…

Rで並列計算 / 関連docなど

Ryan Rosario on Parallel programming in REarlier this year data scientist Ryan Rosario gave a talk on parellel computing with R to the Los Angeles R User Group, and he recently made the slides from the talk available online. They're a grea…

online機械学習とか、不正検知とか。

ネットサーフィンしていて気になったFICOの記事。 Fraud Analytics That Adapt on the Fly - Banking Analytics Blog"robust adaptive modeling"という呼び方をしている考え方はFICOの専売特許ではなく、不正検知に限った話ではなく。 今日日、統計モデル等…

Facebookの顔認識データ

米フェイスブック、顔認識技術のフェイス・ドットコム買収で合意 ↓その後 Germany: Facebook must destroy facial recognition database | Ars Technica German data protection officials today accused Facebook of “illegally compiling a vast photo dat…

周辺情報から推測をする、というデータ分析の使われ方。

友人から聞いて知ったニュース。 404 - Not Found:テレビ東京 (略) また今回は時差があり、深夜の観戦も多く、常盤薬品工業の眠気覚まし飲料「眠眠打破」は二桁で売り上げが伸びているといいます。 ポイントカード類の購買データの分析で、「観戦前の深夜に…

職業観における世代間ギャップ。

先日妻の義父に久々に会い、転職をしましたよという話などをしたり。会話においては彼は、終身雇用ではないということをだいぶ気にしていたようだ。家に帰った後に彼からメールが届く。なんと、終身雇用な会社の方がいいんじゃないのかね、と転職先候補がメ…

転職をするべき判断基準。

この8月から新しい会社で働き始めている。 経験社数は被雇用者としては数社目の経験となる。 この年代で「数」だけを見ると多過ぎなのだが、自身なりに「経験値を伸ばせる」、「市場価値を上げられる」という基準で意思決定をしている。 (とはいえ、金融業…

久しぶりに日記書こうかな?

放置しているこのblog。 環境も変わる事だし、久しぶりにまた書き始めようかな。。。?