ほわいとぼーど

ぷろぐらまのメモ帳

データサイエンティストの始め方[2013/8/9 (Fri.)]に参加してきました。

http://www.zusaar.com/event/876003
http://gihyo.jp/news/report/2013/08/1901

自分はこの分野は素人で理解が足りないのと
UStreamが公開されているので内容については自分が気になった所だけ書きます。


①『誰も語らないデータ分析の3つの現実』TD 田村さん
http://www.ustream.tv/recorded/37058405

・データを溜めただけではビジネスの成功にはほど遠い。
・しかし無いデータは解析できない。
・データを溜めれる人とデータを使いたい人は異なる。
・そのためにもデータ収集コストを下げる→fluentd、スケーラビリティも。

TDの人の話を聞くのは初めてではないので、うなずきながら聞く感じになりましたが、
収集基盤の必要性を論理的に説明できると仕事場での説得も捗る気がしますね。
自分の周りでも未だに「ログは必要な時にコピーしてスクリプト叩いて解析すればいいよね」
とか言ってる人が居て、それ簡単と思ってるかもしれないけど
fluentdで集めとくほうがはるかに簡単なんだけど、っていうのをうまく説明できてないです。


②『スキーマレスなログデータの収集と集計のためのデザインパターン』Crocos 柄沢さん

http://www.ustream.tv/recorded/37058843

・アプリケーションログを収集して解析する。
・1イベント1レコード
・基本的なスキーマを決める。解析のために。
・アプリの知りうる属性を非正規化して含める。
 JOINせずに集計関数に掛けれる。個人情報はハッシュ化しておく等。
・どういう条件のイベントの時にトランザクションが成功失敗したかとか。

かなり現場寄りの技術紹介で非常に試してみたくなりました。
サービス展開している企業では非常に捗るのではないでしょうか。
自分の担当では試せないけど、、、というか1ライナーじゃないログをどうにかしたい。


③『リクルートグループにおける情報活用事例』リクルートテクノロジーズ 西郷さん

Hadoop
・年間200案件くらいで活用。

資料とかは非公開なのですが、リクルート内では情報を有効に活用できているという
事例の紹介でした。西郷さんは基盤チームですが、リクルートの情報を使う側の
人達の要求レベルも非常に高いと感じる内容でした。
さすがに情報を扱うことをメインの会社だけあります。


④『Persuading customers : insights into emotional value from big data』楽天 北川さん
http://www.ustream.tv/recorded/37060883

・楽天とA社の商品の売り方。感情vs理性
 国民の多様性と同一性
・アンケートで話を聞くvs行動を見る。
 本人が本当に望んでいるものを捉える。
・データサイエンスで「おもてなし」を実現。
・事例タオルの再利用①「環境に良いから」35%UP
・事例タオルの再利用②「75%の人が再利用してくれる」26%UP
・事例タオルの再利用③「この部屋に泊まった75%の~」33%UP

4人の中では一番異色に感じましたがうまく言えないけどすごいですね。
それこそ感情に訴えるというテーマを自身で体言されているのかもしれません。
内容的にはデータを活用する更に次のステップを目指している話でした。


データサイテントの分野については素人なのでとりあえず参加した感じでしたが、
アプリログ収集テクについては試せる機会を作れたらいいなと思いました。
あと懇親会にも参加してみたのですがベンダ主導の懇親会は
名刺交換会的な意味合いが強くてしんどいと思いました気をつけよう。