EC2でのクラスター構築と並列計算

EC2でいざクラスターを構築して計算をしようとしても、以外と環境の構築面で足を引っ張られがち。 何かしら無いかと探してみたら、StartClusterというtoolkitを発見。 STAR: Cluster - Home StarCluster has been designed to automate and simplify the pro…

GPGPUの入門用のリソース。

GPU(というかCUDA)の使い方に関して Programming Massively Parallel Processors with CUDA - Stanford の無料コンテンツを iTunes で無料ダウンロード nVIDIAの研究所の人のStanfordでの講義の動画。内容は学生向けと言うだけあり、分かりやすい。(英語も…

GPUでレコメンデーションの計算の高速化

実際のところ、リアルタイムでレコメンデーションを走らせるためには、速い計算機が必要である。 計算量を食わない簡略化したロジックを動かすとか、計算機をクラスタ化して環境を構築する、などのアプローチもあるが、GPUを使って計算を高速化するというア…

"Social Network Analysis"のフリーの講義とフリーのテキストブック。

courseraの"Social Network Analysis"のクラス。 無料でこれだけの内容が提供されていて、それをどこでも見ることが出来るのだから、本当に素晴らしい時代なのだと思う。 Social Network Analysis https://www.coursera.org/course/sna Lada Adamic - This c…

「2020年にアツいビジネス」と個人の差別化

配信されていた記事で、面白そうなものを発見。10 Businesses That Will Boom in 2020 - Yahoo! Finance政府統計(The government's Bureau of Labor Statistics (BLS))などのリサーチを元にまとめた、2020年に活発になっているであろうビジネスのフィールド…

Rでbig dataのハンドリングと並列計算

Online resources for handling big data and parallel computing in R | blog.RDataMining.com Compared with many other programming languages, such as C/C++ and Java, R is less efficient and consumes much more memory. Fortunately, there are som…

ビジネス側でのデータ分析についての本

ビジネス側で道具としてデータ分析を使いたい人のための良い本が少ないように感じる。日本語で出ているデータ分析絡みの本を分類すると、理論書やRで機械学習的な本も最近はあるけれど、そこから一歩離れると、Accessでできるデータ分析入門的な本となり、ち…

iris

機械学習、統計周辺の人は大好きなirisデータセット。 原典はFisherと聞いていたけれど、探してみたら論文のPDFが出てきたよ。 Fisher, R. A. (1936) The use of multiple measurements in taxonomic problems. Annals of Eugenics, 7, Part II, 179–188. Ad…

Rで並列計算 / 関連docなど

Ryan Rosario on Parallel programming in REarlier this year data scientist Ryan Rosario gave a talk on parellel computing with R to the Los Angeles R User Group, and he recently made the slides from the talk available online. They're a grea…

online機械学習とか、不正検知とか。

ネットサーフィンしていて気になったFICOの記事。 Fraud Analytics That Adapt on the Fly - Banking Analytics Blog"robust adaptive modeling"という呼び方をしている考え方はFICOの専売特許ではなく、不正検知に限った話ではなく。 今日日、統計モデル等…

Facebookの顔認識データ

米フェイスブック、顔認識技術のフェイス・ドットコム買収で合意 ↓その後 Germany: Facebook must destroy facial recognition database | Ars Technica German data protection officials today accused Facebook of “illegally compiling a vast photo dat…

周辺情報から推測をする、というデータ分析の使われ方。

友人から聞いて知ったニュース。 404 - Not Found:テレビ東京 (略) また今回は時差があり、深夜の観戦も多く、常盤薬品工業の眠気覚まし飲料「眠眠打破」は二桁で売り上げが伸びているといいます。 ポイントカード類の購買データの分析で、「観戦前の深夜に…

職業観における世代間ギャップ。

先日妻の義父に久々に会い、転職をしましたよという話などをしたり。会話においては彼は、終身雇用ではないということをだいぶ気にしていたようだ。家に帰った後に彼からメールが届く。なんと、終身雇用な会社の方がいいんじゃないのかね、と転職先候補がメ…

転職をするべき判断基準。

この8月から新しい会社で働き始めている。 経験社数は被雇用者としては数社目の経験となる。 この年代で「数」だけを見ると多過ぎなのだが、自身なりに「経験値を伸ばせる」、「市場価値を上げられる」という基準で意思決定をしている。 (とはいえ、金融業…

久しぶりに日記書こうかな?

放置しているこのblog。 環境も変わる事だし、久しぶりにまた書き始めようかな。。。?

CMに公正さを期待するのですか?

あえて、逆の立場で。 とりあえず身近な業界なので、思わず。 分かりにくい保険商品 アピタル(医療・健康) そもそも、この商品は「生命保険」ではありませんし、もちろん「医療保険」でもありません。ポイントは「病気での入院」に対して保険金が支払われ…

技術力が求められる会社

ここらへんは書くと長くなるけれど、簡単に…技術力が正当に評価されない、という考えが多いようだが、それはその会社が(本質的には)技術力を第一に求めているわけではないから。 「技術力=お金」と結びつく会社であれば、もちろん技術力が求められるし、…

優秀な技術者≠技術力

はてなの日記を見ていると、「技術者に対して正しい評価がされない」ということを問題視しているエントリが多いように感じる。これは、はてなで日記を書いている人にプログラム大好きなエンジニアが多いことが要因だと思う。そもそもとして、SI企業がプログ…