2013-01-01から1年間の記事一覧
社内の技術系Adventカレンダー向けに何か書けと言われ、とりあえずボードゲームの思考ルーチンについて書いてみたり。 せっかくなので、存在を忘れかけていたBlogメンテの意味も込めてこちらで公開。 ボードゲームをプレーする=知能? ボードゲーム、その中で…
Siri と Elizaで会話 Siriと、カウンセリングを模した古典的な会話プログラムのElizaを会話させてみたよ、というネタ記事。 大分前なのだけれど、たまたま発見。 Siri Meets Eliza | jordanmechner.com Since I got my iPhone 4S, I’ve been intrigued, fasc…
SunのOSとCompiler開発チームの作者が書いた、Cプログラミングの本。 Cプログラミングと言いながらも、実際にはUNIX OSのKernelに関してや、アーキテクチャについても触れられている。エキスパートCプログラミング―知られざるCの深層 (Ascii books)作者: ピ…
MPI関連を探していて発見した、良質な講義ドキュメント。 [配信講義] CMSI計算科学技術特論A — CMSI web MPI、OpenMP関連、及びその組み合わせについての説明。 また高速化チューニングあたりで説明されている話は、計算機アーキテクチャを理解していない…
先日、同僚と話にのぼったDVD。 kozmoというベンチャーの、創業からIPO直前、ネットバブルが崩壊して創業者たちが取締役を解任され、そして翌年に事業停止をするまでのドキュメンタリー。何が面白いって、創業直後からちゃんと本物の映像として残していると…
大規模データに対するスポットでの分析が(ビジネスとしては)難しい背景。大規模データを蓄積するためには、インフラや人などへの投資が必要。 ROI観点で考えると、「コスト」が増えた分だけ、より高い「リターン」を出さなければROIは悪化する。 しかし、…
データサイエンティストは調査法を軽視している? - Togetter twitterでもreplyしてしまったのだけれども。 言いたい主旨には同意ながらも、用途の違いかな、とも思う。 アドホック的な、何かしらのファインディングを見つけるための分析が目的であれば、そ…
SQLでロジスティック回帰を実装するTipsを発見。 Deep Data Mining Blog: Logistic Regression Model Implemented in SQL SQLしか変更できない本番環境という背景のため、decode()とnvl()を用いてロジスティック回帰を実装、とのこと。 スコアリングの実装の…
先日、某学会で経営工学の学生をしていた頃の先生と、10年近くぶりにバッタリと再会をし。 そこでちょくちょくと話をしていて、経営工学こそデータサイエンティスト育成に近いよね、といった話が出てきたので。 経営工学とは 経営工学って、マイナーだったり…
ちょっと野暮用があり、Topic Modelの実験。 説明とか 私のブックマーク: Latent Topic Model (潜在的トピックモデル) 人工知能学会の私のブックマークから。 latent Dirichlet allocation - 機械学習の「朱鷺の杜Wiki」 LDAについて。 (pdf)Probabilistic t…
ここ数年、最近は広義の意味でのデータ分析全体が熱く、分析者に対する需要も高くなっているけれども、正直、ここまでの今の状態は一過性なのかな、と。俯瞰してみるならば、企業でのデータ分析活用のためのバリューチェーンのなかで、現在は属人的で高付加…
R Graphics Cookbookを買ったり。 主にggplot2まわりの説明がされている感じ。 とりあえずさくっと検索して使うといった、ちょっとしたリファレンス用途によい感じ。R Graphics Cookbook作者: Winston Chang出版社/メーカー: Oreilly & Associates Inc発売日…
統計処理のための処理系であるRで、あえてオセロ。 ちゃんとコンピュータと対戦できます。 さくっJokeのつもりで書きはじめたのですが、細かいところにこだわりはじめたら意外と長くなってしまいました。 操作画面 マウスで操作できる人間にやさしい作り。 l…
お仕事で、べき乗分布(power-law)に従った乱数発生をする必要が生じたので、さくっと。 べき乗分布の乱数 検索したら出てきたのがこれ。 Random Number -- from Wolfram MathWorld べき乗分布に従った乱数は、がの一様乱数、がべき乗係数、のとき、以下とな…
保険業界におけるBigData、Analyticsへの取組に関する調査レポート。ちょっとだけ古いのだけれども。Big Data and Analytics in Insurance 保険業界の現状 General hype about Big Data is refocusing insurers on analytics, but relatively few insurers a…
とある大学が作成してフリーで提供しているDataScience入門とかいう教科書。フリー。 ぱっと見た感じ、深くは踏み込んではいないけれども、広いTopicで簡潔にサンプルコードが提示されているので、入門者にはよさそうです。Free e-book on Data Science with…