パラメータ推定で分からなくなったことあれこれ

〇重回帰モデルにおけるパラメータの検定

各パラメータの検定は、各パラメータの値から求まるt統計量が標準正規分布に従うことを用いた検定（t検定）で済む。

であれば、全てのパラメータが0であるという結合仮説の検定（F検定）は何のためにするのか？確かに、多項式モデルの場合は、ある変数が全体として必要か否かをまとめて検定する必要があるので、結合仮説用の検定が必要だ。結合仮説の検定を各パラメータのt検定の総合としてできないのは、t統計量の相関係数によって有意水準が変動するからだ（数が多くなっていくと甘くなる）。

しかし、多項式モデルでない場合に、なぜF検定が必要になるのか分からなかった。

〇パネルデータ分析での個別トレンドの導入

固定効果モデルにおいて、個人効果は「時間不変で人によって違う変数」、時間効果は「時間によって違う全員に同じ変数」であり、両者をモデルに組み込むことで、興味のある「時間によって違う人によって違う変数」の効果を偏りなく推定できる。

しかし、「時間によって違う人によって違う変数」である個別トレンドを入れてしまうと、興味のある変数と多重共線性が生じないのだろうか。もちろん、やろうとしていることは重回帰による欠落変数への対処と同じことなので分かるが、個人効果や時間効果の場合は全要素が定数項として含まれてしまうので、ほぼ確実に多重共線性が起こる（と思う）。

個別トレンドをしっかり理解できていないので、もう少し勉強したい。

〇操作変数を使った場合の推定法

過少識別の場合は推定不可、丁度識別の場合はモーメント法と2SLS推定量の両方で可、過剰識別の場合は2SLS推定量のみで可なのであれば、常に2SLS推定量の方法で推定すればよくないか。

また、説明変数が内生かどうか検定するハウスマン検定は、操作変数が利用可能であることが条件である。2SLS推定量よりも標準誤差が小さいOLS推定量を使うメリットが存在するため、ハウスマン検定で「内生性はない」とすることができればOLSを使うモチベーションは存在することになる。しかし、2SLSの分散が大きい場合はハウスマン検定は棄却しにくくなるので、「ちゃんと検定できていない場合にOLSで正しいと思い込んで偏りのあるOLSを使う」ということになりかねず、操作変数が使用可能な時には2SLSを使うことが奨励されている。ならば、ハウスマン検定の必要性は何もない。

解決したら編集したい

男子大学生の日常

男子大学生の雑記ブログです

パラメータ推定で分からなくなったことあれこれ