hopping around

~ヘタレ研究者は今日も逝く~

northwestern ws day 1

で,昨日からNorthwesternでのworkshopに参加しているわけですが。

まぁ,Donald Rubinが計量経済学が嫌いだってことはペーパー読んでいれば明らかではあるけれど,実物がここまで嫌っているとはwwwって感じ。確かにcausal inferenceの生き証人であるわけだけれども。Heckmanと同席させて喧嘩させてみたいなーと思う次第。Levittみたいにヘタレずに(←この小咄は法セミ連載でそのときが来たら書きます)ガチバトルしてくれそうでwktk

で,Rubinについては想定内だったのだけど,想定外だったのがBlack。彼は,会社法をメインに経済分析する人っていうイメージがあったのだけど,全然違ったwww

inverse propensity score reweightingを説明してくれたのだけれども,propensity scoreの端っこの方(上下10%ずつ)はunobservableが多く介在しているcovariate balanceが上手く働かないところだからといって,ばさっと切り捨てた。工工工エエエエエエェェェェェェ(゚Д゚)ェェェェェェエエエエエエ工工工 だってそこは,distributionが一番厚くなっていて,そこの情報をばっさり切り捨てるなんてもったいなさ過ぎる... 確かにpropensity scoreの思想にはあっているんだけれども,切り捨てられたところに中心的な情報が入っているなら,Heckman's two-stepみたいな形でそこの行動をモデル化して情報を活用する方が,データに含まれている情報を有効活用できるぢゃないか,って思う。ある意味,切り捨てられなかったところは,元のdistributionからすると「変なやつ」の集合体であって,そのデータでsubclassification / matchingするってどーゆーことよ,と思わざるを得ない。

経済学を使うことなんて頭の中にはなくて,いかにcovariate balanceを作り出すか,っていうdata mining屋さんの発想しかない感じ。うーん,エコノメではなくて,STATオタクなのか。それとも,最近の統計分析手法の発展にあてられて,STATがマイブーム(死語)になってしまったのか。経済学の影も形も見当たらない...

それと,上下10%を切り捨てるというなら,「何で10%なの?5%でも15%でもいいぢゃん?」という質問が当然のように飛んでくる。で,それに対してBlackがどう答えたかというと:

10%という数字は,最後の分析をする前のリサーチデザインの段階で決める。一度決めたら後戻りしない。

工工工エエエエエエェェェェェェ(゚Д゚)ェェェェェェエエエエエエ工工工 無理!絶対に無理!

確かに理系の実験なんかでprotocolを決めてから実験するというのは当然なわけだけれども(そしてSTAT屋のRubinはこの発想に同意するだろう),社会科学の世界では閾値の数字を操作したいという誘惑には勝てないぉ。実際,Stataコードの2行を書き換えるだけですんでしまうし。Blackも絶対にいくつかの数字を試したに違いない。なので,彼がこの言葉を本心から言ったのか,怪しい(とはいえ,ジョークを言ったような感じではなく,かなり強く断言してた...)。

というわけで,なかなかショッキングなws初日でした。