男子大学生の日常

男子大学生の雑記ブログです

面白い映画

スターウォーズとかスタートレックとかジュラシックワールドとか、シリーズ物は除外。

 

・メッセージ

インターステラー

インセプション

ノーカントリー

プリズナーズ

・ゴーンガール

・バーニング

・ドラゴンタゥーの女

・GUILTY

・search

・ルーム

ミスティックリバー

ソーシャルネットワーク

それでも夜は明ける

・パラサイト

・バーニング

殺人の追憶

・ムーンライト

・シェイプオブウォーター

・アルゴ

ブラック・スワン

誰よりも狙われた男

・バードマン

・ビューティフルマインド

・時計仕掛けのオレンジ

アメリカンスナイパー

・ブラック・クランズマン

・スリービルボード

・ワールドウォーZ

・シカゴ7裁判

サウンドオブメタル

・ジョーカー

女神の見えざる手

・ウインドリバー

・バベル

シックスセンス

羊たちの沈黙

カッコーの巣の上で

万引き家族

ディパーテッド

・告白

・カメラを止めるな

そして父になる

タイタニック

パルプフィクション

プライベートライアン

・ヘイトフルエイト

チェンジリング

ダークナイト

プレステージ

メメント

・TENET

・ゲットアウト

・透明人間

・セッション

・海街ダイアリー

・ゼロダークサーティ

ウィンストン・チャーチル

サーミの血

・大統領執事の涙

・レオン

トゥルーマンショー

サウルの息子

シャッターアイランド

マイノリティ・リポート

・9人の翻訳家

・テロ、ライブ

コンテイジョン

・ゼロダークサーティ

・ザ・レポート

・ボーダーライン

リンカーン

・マージンコール

・天使と悪魔

・パワー・オブ・ザ・ドッグ

・2人のローマ教皇

映画レビュー:『殺人の追憶』(2003)

〇感想 4/5点

無能な刑事たちのドラマ。

捜査能力も低く、容疑者の取り調べでは拷問をし、事件を解決させようと噓の証言を無理矢理言わせ、容疑を否定する鑑定結果を見たら銃殺しようとし、酒に酔ったら一般人にも暴力をふるい、目撃者を事故死に追い込み、殺人事件が5,6回起きても犯人の手がかりを何一つ見つけられない。

刑事たちによって、(事件の被害者も含め)様々な罪のない村人が苦しむ様子がかわいそうになってくる。

私は『パラサイト』もそこまで絶賛はしていないが、本作もrotten tomatoesで90点を超えてるのは少し理解に苦しむ。いや、面白かったんけど、個人的には80点くらいかな…

 

今調べたら、2019年に犯人は特定されたらしい。もっと驚いたのは、拷問によって自殺者まで出たということだ。実際に。

さすがには今はそんな捜査ないと思うが、個人的な経験でも、町で話しかけてくる警察官とかがため口だったりするのには少し不快感を覚える。普通大学生くらいの年齢で初めて会った人だったら、敬語を使うだろ。区役所とかコンビニとかでため口使われたことないのだが、なぜ彼らはためぐちなのか意味が分からない。

 

役に立つ教科書

大学の4年間で気づいたことは、学習の始めは重厚な教科書を数冊こなすことが重要だということだ。指導教員は「新書を多読しろ」とアドバイスしてきたり、簡単な本を紹介してきたが、それらは有害だ。中途半端な本をやっても、表面的すぎて何の役にも立たないことが多く、結局後で勉強し直すので、効率が悪すぎる。また、あまりにも分かりやすいと、勉強よりも読書になってしまい、「面白かったけど何も身につかなかった」ことになる。

ということで、ちゃんとした本を以下で紹介する。難しいかもしれないが、「立ち止まって、自分が理解できるところまで下がって、次に行く」ということを繰り返していけば読破できる。しかも、教科書の後に論文で得た知識は教科書に書き込んでいけばよいので、学習のベースになる。新しく見つけたら追加していく。

 

ミクロ経済学・数理社会学

神取2014『ミクロ経済学の力』

岡田2021『ゲーム理論 第3版』

盛山他2015『社会を数理で読み解く』

 

社会心理学行動経済学

池田他2019『社会心理学 補訂版』

大垣・田中2018『行動経済学 新版』

 

~遺伝学~

※今のところ知りません、何かあったらコメントで教えてください

 

~生物進化・文化進化~

※生物進化は、今のところ知りません、何かあったらコメントで教えてください

(『入門!進化生物学』→新書だがまとまりはよく学び多い)

田村2020『文化進化の数理』

 

~計量分析~

江崎2020『データ分析のための数理モデル入門』

久保2012『データ解析のための統計モデリング入門』

西山他2019『計量経済学

末石2015『計量経済学

岩間他2018『Rによる多変量解析入門』

統計モデリングとは何か?

以前の記事で、科学を行う際に、理論と実証の区別がちょー重要であるという話をした。しかし、近年その境界線は揺らいできている。

一般的に、計量分析・統計分析というのは、現実の世界のデータを分析するので、実証の方に含まれる。しかし、wikipeadiの「統計モデル」のページに「統計モデルは『理論の正式な表現』である」と書いてあるように、統計モデルは何らかの理論を基にしなければそもそも構築できないので、実際は理論がまず必要である(「予測精度」が主目的である状況ではいくつかのモデルを試して最も予測精度が高いモデルを選択するという戦略が有効だが、「真理の解明」が主目的である状況では特に理論的基礎の重要性が大きい)。これまでの実証研究の多くは、重回帰やロジスティック回帰などの汎用的・基礎的なモデルを借用していたが、そろそろ各研究の目的にあったオーダーメードのモデルを作りましょうよという話になってきている。そして、オーダーメードのモデル構築は「統計モデリング」と呼ばれ、理論と実証を接続する概念になりつつあるのだ。

 

そもそも計量分析に本質的な要素とは何なのだろうか?重回帰分析、ベイズ推定、t検定、正規分布、F検定、多重代入法、操作変数法、、、計量分析を学ぶとあまりにも様々な概念が出てきて、それをいちいち学は目になるのだが、上記の概念は「水準」「特性」が違う。計量分析のプロセスは、

①モデル構築→②パラメータ係数の推定→③パラメータ係数の検定→④モデルの評価

である。

①モデル=変数×パラメータ×数理構造。統計モデリングとはモデルを構築することである(というか理論研究の数理モデルも上記の3要素からなるので、それと実質的な差異はない。だから理論と実証の境界が揺らいでいるのである)。オーダーメードが難しい人は、すでにあるモデルを借用するのが便利で、一般化線形モデル、一般化線形混合モデル、階層ベイズモデル、微分方程式モデル、確率モデル、時系列モデル、機械学習モデル(決定木やニューラルネットワーク等)、強化学習モデル、エージェントベースモデル(ゲーム理論やネットワーク含)等があるので、まずそれらを勉強した方が良い。

~②以降はデータをモデルにフィットさせて出てくる値を使う~

②モデルの「変数」はデータがあり、「数理構造」はそのままなので、「パラメータ」を推定できる。推定方法は、最小二乗法(OLS)、最尤法、ベイズ推定の主に3種類あるので、状況に応じて使い分ければ良い。

③係数が推定できたとしても、その値はサンプルの取り方によって確率的に揺らぐ値であるため、その揺らぎも考慮した上で係数の大きさを評価する必要がある。係数の値と係数の標準誤差から検定統計量が算出でき、検定統計量がある分布に従うことを仮定すれば、係数の値を評価することができる(大体の場合は母集団において0か否か)。

④どんなモデルに対してもデータをフィットさせてパラメータ推定することは可能だが、めちゃくちゃなモデル(現実では想定している関係性など全くないのにそのような関係性を想定して作ったモデル)かもしれない。そこで、自分が構築したモデルが妥当なのかを「データの当てはまりの良さ」という基準で評価する(「当てはまりの良さ=現実の真理への近さ」と仮定することが多い)。この評価基準もいくつかあって、AICBIC、WAIC等があるので、状況に応じて使い分ければ良い。

 

最近話題の統計的因果推論は、従来の計量分析が全て相関に依存していたことを批判する。例えば線形モデル(単回帰分析)は、原因→結果の因果効果を測っているように錯覚させるが、その係数は相関係数に基づいて算出されるものであるため、交絡や逆の因果の影響を受けている。つまり、係数の推定値の不偏性を除去しようというモチベーションの下、適切なモデル構築、リサーチデザインをしましょうということだ。2つに分けて書いたように、因果推論はモデル構築に関わるもの(固定効果モデル、傾向スコア、操作変数法)だけではない。ランダム化比較試験はモデルの外でランダム性を確保している例であり、実験群と対照群の結果(データ)をt検定するだけで良い(このt検定自体も上記の統計モデリングのプロセスの中で解釈可能であるため、上記のプロセスは全ての計量分析の統一的フレームワークである)。

 

これまでの実証研究では、理論を全く意識することなく、その場でテキトーに作った仮説を重回帰分析やロジットモデルで検証するだけで良かったかもしれないが、そんな時代は終わりつつある。理論研究をちゃんとフォローしていないとそもそも意味のあるモデルを作れない。

 

つまり、

 

①理論の勉強

②汎用的なモデル・推定・検定・モデル評価指標の勉強

③分野特殊的なモデル・推定・検定・モデル評価指標の勉強

④因果推論の勉強

 

が必要になると思われる。気を付けてほしいのが、①と③は「自分が使うものを適宜勉強する」方式にしないと、膨大すぎて勉強しきれないということだ。昔やみくもに勉強して、半年後何も覚えていなかったということがあった。②④は汎用性がとても高いので、一通り勉強する価値があると思う。

カテゴリーの説明

学問系は、テーマ、数理モデル(理論)、計量分析(実証)の3つがあります。

大まかに以下のように分類しています。

 

テーマ:各テーマ特有の知(理論研究や実証研究)を扱った記事

数理モデル(理論):テーマ汎用的な数理モデルの知識を扱った記事

計量分析(実証):テーマ汎用的な計量分析の知識を扱った記事

 

田村2020『文化進化の数理』を読んで

~文化進化研究の本質的な点の要約~

文化進化研究における、「文化」の定義は「遺伝子を介さない手段によって伝達される情報」である。各個体が持っている情報は「文化形質」、伝達は「学習」と呼ばれる。

文化小進化では、個体によって持っている文化(文化形質)が異なる。「個人が文化形質を保有する」と考えるので、分析単位は個体であり、文化形質そのものではないことに注意(伝統芸能が衰退しているかどうかを測定する指標は、伝統芸能を実践している個体の数である)。文化大進化では、ある大きさの集団が1つの個体としてモデリングされる。

また、文化形質を獲得(学習)する方法には2種類あり、自分で生み出す「個体学習」と他者から伝達される「社会学習」である。前者は「突然変異」に対応しており、後者は「遺伝伝達」に対応している。しかし、遺伝と異なるのは親からの伝達が存在することであり、社会学習の伝達経路は「垂直伝達」「斜行伝達」「水平伝達」がある。また、伝達プロセスには、集団の構造や移住、学習バイアスなどの様々な要素が影響しており、それらをモデルに組み込むことができる。モデルに組み込む要素が大きいほど仮定が多くなっていき、解像度は上がっていく。

環境によって各文化形質の適応度が異なるのは遺伝形質と同様であり、文化形質と適応度を対応させた「適応度地形」という図がある。

文化進化の理論研究の目標は、「文化形質が伝達するプロセス(学習プロセス)を数理モデルで表し、文化形質の頻度変化のパターンを完全に再現すること」である。一応、数式とシミュレーションの2つの方法があるが、どちらもモデルが必要となる。

他方で、文化進化の実証研究の目標は、2つ?ある。1つ目は、「上記の理論のプロセスが現実で生じているか否かをデータによって検証すること」である。実証研究では、プロセスAとプロセスBのどちらがより働いているのかを識別できるようなリサーチデザインが求められる。2つ目は、「数理モデルに含まれる変数にデータを投入し、パラメータを推定する」ことである。こちらは線形モデル等の単純なモデルではなく、複雑な数理モデルにデータを最尤法やベイズ推定で当てはめる統計モデリングの域に入っている。

理論は仮説を提示できなければならない。仮説を提示できれば、データによって仮説を検証でき、理論の現実的妥当性を確認できる。

 

とにかく、文化進化は生物進化とのアナロジーがほぼ全てと言ってよい。

生物進化:変異や突然変異によって遺伝子(遺伝的形質)の頻度が時間変化する。その背景にあるプロセスは自然選択(淘汰)である。

文化進化:社会学習や個体学習によって文化形質の頻度が時間変化する。その背景にあるプロセスは自然選択(淘汰)、伝達経路、学習バイアスである。

 

~感想と考察~

文化進化研究は「形質の頻度の時間変化のパターンを完全に説明する数理モデルの構築」が最終目標であるため、人間の形質に遺伝子や環境がどのように影響しているのかという静的な思考法とは相いれないのかもしれない。

個体Aがある形質を保有しているのは、生物進化では「淘汰の中で残ったから」であり、文化進化では「淘汰の中で残ったから、伝わりやすかったから」である。ある一時点において、個体Aの形質が個体Aの遺伝子や環境に規定されていることは実際問題妥当だと考える。しかし、生物進化や文化進化の研究で関心があるのは、形質の頻度が集団レベルで時間によってどう変化するかである。つまり、関心の違いに帰着するのかもしれない。

 

以下で一例を考えながら、枠組みの関係性を分析してみたい。

 

例えば、「学力」という形質を例に挙げよう。行動遺伝学のACEモデルでは、ある形質は、遺伝子・共有環境・非共有環境によって形成される。3つの寄与度がデータから計算され、遺伝率〇%という結果が出る。

一方で、上記の文化進化の枠組みではどのように理解できるだろうか。「学力」を「数学の知識」(情報)に基づいて「テストで良い点を取る」(実践)に変換する。すると、個体Xが数学の高度な知識を有しているのは、自分で勉強した(個体学習)からかもしれないし、親から教わった(垂直伝達)からかもしれないし、教師に教わった(斜行伝達)からかもしれないし、友達に教わった(水平伝達)からかもしれない。垂直伝達は共有環境、斜行伝達と水平伝達は非共有環境に対応するだろう。しかし、この枠組みには遺伝伝達は出てこない。数学の知識(情報)が遺伝を通じて直接的に伝達されるとは考えにくいからである。遺伝によって伝達されるのは非認知能力とか推論能力とかであり、それが学習に影響すると考えられる。文化進化の目標は、数学の知識(情報)の伝達プロセスと知識の保有(学力)の頻度変化のパターンを解明することになる。

 

結論は以下の通りである。

ある形質が「情報を学習して行動する」こととして解釈可能であれば、文化進化の枠組みは適用可能である(情報がカテゴリカルな方が親和的)。そこで興味があるのは、「情報の伝達プロセス」である。遺伝子の働きを無理矢理組み込むならば、個体学習や社会学習の起こりやすさに遺伝による先天的能力が影響すると仮定する感じだろうか(同じ教師の授業でもたくさん学ぶ生徒と学ばない生徒がいる)。とにかく、文化進化の研究が遺伝子以外を介して伝えられる情報に的を絞っている以上、その中に遺伝子の影響を組みこむのは難しそうだ(リサーチデザインによっては、遺伝の効果は垂直伝達に含まれてしまう可能性もある)。個人形質⇔社会環境の関係について扱った研究と位置づけることができるだろう。

 

ACEモデルは変数間の関係性を扱っているため、個体を超えたマクロな議論である(というか分析単位を個人に設定する場合、遺伝子とか制度とかは分析のモデルの中で実体のないものになる)。誰から誰に伝達されるかというのは個体レベルの議論なので、ミクロな議論である。

 

最終的に行きついた先は、分析社会学や計算社会科学の議論と似ている。因果推論で「教育→賃金」という因果効果を推定した時に、「教育」とか「賃金」は実体ではない。個人が大学に行く、個人が働いて金を稼ぐといった具体的な行動が実体である。現実で因果関係は物理法則として働いている(家を出る→電車に乗る→大学まで歩く→階段を上る→図書館に入る→勉強する→…)。

文化進化研究はネットワーク分析と同じく、個人単位のモデルを組もうとしたものである。

それに対し、ACEモデルや因果推論、多変量解析などの実証系の研究は(実体のない)変数間の関係を分析しているにすぎない。結果的に、データのパターンの分析はできても、プロセスのモデリングには使えない。

 

 

もはや文化進化とは関係ないところまで来てしまったが、上記の考察をしたことで、私の思考が少し整理された。

・科学の最終目標は、現象のプロセスを正確に表す理論(モデル)の構築であり、その理論(モデル)はパターン(現象の結果のデータ)を完璧に再現する

・そして、理論(モデル)の単位を何に設定するかが問題であり、個人とするか変数とするかによって大きく異なる

 

これまで社会学に使っていた私は、理論(モデル)というものを全然知らなかった。特に、個人を単位とした理論(モデル)は知らなかった。

まずは、これらの考え方に慣れることが大事だと思うので、慣れたい。

 

また、研究の進め方をようやく理解することができた(気がする)。

①理論(モデル)を勉強し、プロセスを理解する

②「本当にその理論(モデル)が正しく現実の現象を反映しているのか」がデータによって検証されているのかを調べる

→検証されていない部分があるなら、それを検証する・・・実証研究

→パターンの再現に気を付けながら、理論(モデル)に新しい要素を加えて、拡張する・・・理論研究

 

理論(モデル)で難しいのは同一のパターンを帰結するプロセスが複数通り考えられるということだ。その際には、プロセスAとプロセスBを識別できるような実験デザインを構築して、どちらのプロセスが現実で働いているかを検証することになるのだろう。

また、1つ気を付けておかなければいけないと感じた点がある。それは、理論(モデル)の目標は現実の現象を正確に捉えることであって、机上の思考実験ではないということだ。この本を読んで退屈に感じてしまった一つの理由は、モデルが現実をどう説明しているのかが全く分からなかったことだ。そもそも「現実の現象」への言及がほとんどなかった。恐らく、個々の論文では具体的な現象について数理モデルが適用されているのであろうから、本書を読んだら、具体的な論文を読まないと始まらない。