諸概念の迷宮(Things got frantic)

歴史とは何か。それは「専有(occupation)=自由(liberty)」と「消費(demand)=生産(Supply)」と「実証主義(positivism)=権威主義(Authoritarianism)」「敵友主義=適応主義(Snobbism)」を巡る虚々実々の駆け引きの積み重ねではなかったか。その部分だけ抽出して並べると、一体どんな歴史観が浮かび上がってくるのか。はてさて全体像はどうなるやら。

【雑想】統計科学の暗黒面について

f:id:ochimusha01:20190607182238j:plain

1世紀以上にわたり、この指数はさまざまな科学分野で使用されてきました。この論文では、忘れられたり無視されたりする事の多い研究黎明期の状況を紹介します。そこで取り上げられるのはBravais、Galton、Pearson、砲術研究家、Spearmanなどの信者達の仕事です。その成立過程についての知識は、研究者が仕事の係数の平均をよりよく理解するのに役立つ事でしょう。現在の統計理論とその実践に関する重要なヒントにつてもコメントで触れています。

無名の砲術研究家artillery scientists)」がサラッと名を連ねているのが興味深いです。以下の様な話について、何か補完情報が得られそう?

相関係数(correlation coefficient) - Wikipedia

2つの確率変数の間にある線形な関係の強弱を測る指標。無次元量で、−1以上1以下の実数に値をとる。相関係数が正のとき確率変数には正の相関が、負のとき確率変数には負の相関があるという。また相関係数が0のとき確率変数は無相関であるという。

  • たとえば、先進諸国の失業率と実質経済成長率は強い負の相関関係にあり、相関係数を求めれば比較的−1に近い数字になる。

    f:id:ochimusha01:20190607172816g:plain

  • 以下の図は(x, y) の組とそれぞれの相関係数を示している。相関は非線形性および直線関係の向きを反映するが(上段)、その関係の傾きや(中段)、非直線関係の多くの面も反映しない(下段)。中央の図の傾きは0であるが、この場合はYの分散が0であるため相関係数は定義されない。

    f:id:ochimusha01:20190607155643p:plain

相関係数が±1に値をとるのは2つの確率変数が線形な関係にあるとき、かつそのときに限る。また2つの確率変数が互いに独立ならば相関係数は0となるが、逆は成り立たない。

普通、単に相関係数といえばカール・ピアソン(Karl Pearson, 1857年〜1936年)の積率相関係数を指す。ピアソン積率相関係数の検定は偏差の正規分布を仮定する(パラメトリック)方法であるが、他にこのような仮定を置かないノンパラメトリックな方法として、スピアマンの順位相関係数、ケンドールの順位相関係数なども一般に用いられる。

数学的定義との微妙な距離感…
線型独立(linearly independent) - Wikipedia

線型代数学において、ベクトルの集合が線型独立または一次独立であるとは、線型従属(一次従属)でないこと、つまり集合のベクトルの線型結合によるゼロベクトルの表示が自明なものに限ることをいう。

f:id:ochimusha01:20190607173534p:plain

例:ベクトル空間 R2 の部分集合 {(1, 0), (0, 1), (-2, 1)} は非自明な線型関係 2(1, 0) - (0, 1) + (-2, 1) = 0 を満たすので線型従属である。他方 {(1, 0), (0, 1)} は線型独立である。

地理的な例は線型独立性の概念を明確にする助けとなるだろう。ある場所の位置を記述している人は「それはここから3キロ北で4キロ東」と言うかもしれない。これは位置を記述するのに十分な情報である、なぜならば地理的な座標系は 2-次元ベクトル空間と考えることができるからである(高度と地球の表面の曲がりは無視して)。その人は「その場所はここから北東に5キロ」と付け加えるかもしれない。この主張は正しいが、必要でない。

この例において「3キロ北」ベクトルと「4キロ東」ベクトルは線型独立である。つまり、北ベクトルを東ベクトルの言葉では記述できないし、逆もまたしかり。三番目の「5キロ北東」ベクトルは他の 2 つのベクトルの線型結合であり、ベクトルの集合を「線型従属」にする、つまり、3つのベクトルのうち1つは不要である。

また次のことにも注意しよう。高度が無視されない場合、線型独立な集合に第三のベクトルを付け加えることが必要になる。一般に、n 個の線型独立なベクトルは n-次元空間の任意の位置を記述するために必要である。

そう、数学上線型独立は「直交」の重要条件なのです。多くの円関数はこの境界を乗り越えられず、そのせいで半円しか描けません(だから概ね逆関数とペアを形成する)。
f:id:ochimusha01:20190506135048p:plain
f:id:ochimusha01:20190522062425g:plain
交互に周期的に「死んだ振り」 と「復活」を繰り返すサイン波とコサイン波のペアの優秀さ…地道に重要だったりします。
f:id:ochimusha01:20190512232958g:plain

直交(orthogonal) - Wikipedia

術語orthogonal は「直立」を意味する古代ギリシア語: ὀρθόςと「角度」を意味する古代ギリシア語: γωνίαに由来する。古代ギリシア語の ὀρθογώνιον および古典ラテン語orthogonium はもともとは矩形を意味する語であり、のちに直角三角形を意味する語ともなったが、12世紀にポスト古典ラテン語orthogonalis は直角および直角に関連する概念を指すものとなっていた。

初等幾何学、すなわちユークリッド空間内においては交わる二つの直線や平面のなす角が直角であることを意味する。

内積空間 V における2つのベクトル x, y が直交するとは、それらの内積 ⟨x, y⟩ が零となるときに言い、x ⊥ y と書く。内積空間 V の二つの部分線型空間 A, B が互いに直交するとは、A の各ベクトルが B の任意のベクトルに直交するときに言う。V において A に直交する最大の部分線型空間 B を、V における A の直交補空間 A⊥ という。

ベクトルの集合がどの二つも互いに直交する (pairwise orthogonal) とは、それらベクトルの任意の対が互いに直交するときに言い、どの二つも互いに直交するようなベクトルの集合はしばしば直交系 (orthogonal set, orthogonal system) と呼ばれる。内積空間における直交系は線型独立系である。

スピアマンの順位相関係数 - Wikipedia

統計学において順位データから求められる相関の指標である。チャールズ・スピアマン(Charles Spearman、1863年〜1945年)によって提唱された。

  • スピアマンはイギリスの心理学者で、人間の知能のモデルに関して先駆的研究を行い、異なる認知テストの結果が単一の因子に帰せられることを発見してこれをg因子(一般能力)と名付け、知能はこれとs因子(特殊能力)の2因子からなると考えた。また統計学の分野でも因子分析の開拓者として、またスピアマンの順位相関係数の開発者として知られる。
  • 15年間陸軍士官を務めたが心理学を志し、退役して実験心理学を学んだ。当時イギリスでは心理学は哲学の一分野としか見られなかったので、実験心理学で先駆的業績を挙げていたライプツィヒヴィルヘルム・ヴントに学んだ。
  • 1897年からボーア戦争による中断をはさんで研究を続け1906年に博士号を取得。1904年には知能の因子分析に関する先駆的な論文を発表した。ウィリアム・マクドゥーガルの後任としてユニヴァーシティ・カレッジ・ロンドンに招かれ、1911年に哲学教授に、1928年には心理学部が創設されてその教授となり、1931年まで務めた。
  • フランシス・ゴルトン(Sir Francis Galton、1822年〜1911年)の研究に強い影響を受け、彼が創始した相関などの統計学的方法を用いた。1904年に順位相関係数を、また1907年にはその補正版を発表。しかし彼の統計学に関する研究はゴルトン直系の同僚カール・ピアソンには評価されず、2人の間には長く反目が続いた。

ふつうρ あるいは rS などと書かれる。ピアソンの積率相関係数普通に相関係数と呼ばれるもの)と違い、ノンパラメトリックな指標である。すなわち2つの変数の分布について何も仮定せずに、変数の間の関係が任意の単調関数によってどの程度忠実に表現できるかを評価するものである。「変数間の関係は線形である」と仮定する必要も、また変数を数値的にとる必要もなく、順位が明らかであればよい。

原理的にはスピアマンの順位相関係数はピアソンの積率相関係数の特別な(相関係数を計算する前にデータを順位に変換した)場合に当たる。しかしρ を計算するには普通もっと単純な手順が用いられる。生のスコアを順位に変換し、各観察(各ペア)における2つの変数の順位の差D を計算する。

スピアマンの順位相関係数の母集団の真のρ が有意に0と異なるかどうかを検定する方法は複数存在する。

標本数が約20以上の場合、観察値のt検定値は帰無仮説二変数が相関なし)が真であると仮定した場合に近似的にスチューデントのt分布自由度n-2に従う。

他にもフィッシャーのz変換を用いてZ値を計算する方法や、パーミュテーションテストを用いる検定方法もある。

また、教科書にはスピアマンの順位相関係数の数表が載っていることも多く、この数値と比較する方法は、応用範囲が限られていると言うものの煩雑な計算を用いる必要がなく便利である。

フランシス・ゴルトン(Sir Francis Galton、1822年〜1911年) - Wikipedia

イギリスの人類学者、統計学者、探検家、初期の遺伝学者。母方の祖父は医者・博物学者のエラズマス・ダーウィンで、進化論で知られるチャールズ・ダーウィンは従兄にあたる。

父は裕福な銀行家のサミュエル・テルティウス・ゴルトン、母ビオレッタはエラズマス・ダーウィンの娘で、チャールズ・ダーウィンの父ロバート・ウォーリングとは異母兄妹であった。キングス・カレッジ・ロンドンでしばらく医学を学んだ後、ケンブリッジ大学で数学を学ぶ。ケンブリッジ大学卒業からまもなく父が死ぬとその遺産で世界各地を旅し、アフリカの探検記を著した。探検の成果は、英国とフランスの地理学会から表彰された。

ゴルトンにアフリカ探検を勧めたいとこのダグラス・ゴルトンが、フローレンス・ナイチンゲールのいとこと結婚した関係から、ナイチンゲールより大学への統計学講座寄付の相談を受け、後年、自らが実現することになる。

1859年、いとこのチャールズ・ダーウィンが『種の起源』を出版したことに刺激を受け、遺伝の問題を統計学で解決しようと思い立ち、研究を開始。優生学と近代統計学の父ダーウィンの進化論の影響を受け、心的遺伝への興味から出発し、人間能力の研究、優生学(eugenics)、相関研究を含む統計的研究法を発達させ、今日の個人的心理学の基礎をつくった。

1883年に優生学という言葉を初めて用いたことで知られている。1869年の著書「遺伝的天才(Hereditary Genius)」の中で、彼は人の才能がほぼ遺伝によって受け継がれるものであると主張した。そして家畜の品種改良と同じように、人間にも人為選択を適用すればより良い社会ができると論じた。当時のイギリスでは産業革命からしばらく過ぎ、社会主義思想の広まりとともに労働者の環境も改善されつつあったが、ゴルトンは社会の発展のためには環境の改善よりも生物学的な改良が有意義だと信じていた。

統計学における貢献としては、平均への回帰と呼ばれる現象についての記述を初めて行ったことや、相関係数の概念の提唱などが挙げられる。

ヴィルヘルム・ヴント同様内観に優れた人物で、心像(image)の研究が有名であるが、学派を持たなかったので、ヴントほど影響は与えなかった。やがて、ジェームズ・キャッテルらによる個人差の研究、mental testが、新大陸アメリカで目覚ましい発展を遂げたのである。

1904年にユニバーシティ・カレッジ・ロンドンにゴルトン研究室が設立された。1907年、死去の直前には大学に遺産を寄贈し、優生学統計学の教授職が設立された。初代教授には教え子で共同研究者でもあったカール・ピアソンが就任し、エゴン・ピアソン、イェジ・ネイマン、ロナルド・フィッシャーと継がれていった。ゴルトン研究室にはライオネル・ペンローズ、J・B・S・ホールデン、シェイラ・メイナード=スミス(ジョン・メイナード=スミス夫人)、セドリック・スミス、W.D.ハミルトン、ジョージ・プライスらが所属していたことがあり、2000年に閉鎖されるまで人類遺伝学と統計学、数理生物学の発展の原動力となった。

 やっぱり現れたか「ミス軍務省ナイチンゲール

ヴィルヘルム・ヴント(Wilhelm Maximilian Wundt、1832年〜1920年) - Wikipedia

ドイツの生理学者、哲学者、心理学者。 実験心理学の父と称される。哲学者のマックス・ヴントは息子である。

  • バーデン地方およびプファルツ地方に近接するドイツ中南部マンハイムのネッカラウに牧師の子として生まれる。12歳の時、テュービンゲン大学に入学。高校時代に落第して転校したくらい高校時代まで学校嫌い・勉強が嫌いであったが、ハイデルベルク大学医学部に入学してからは猛勉強をする。1857年に同大学を卒業。1858年から5年間、ヘルムホルツの助手をつとめる。

  • 1862年から私講師として「自然科学から見た心理学」「生理学的心理学」といったタイトルの講義を担当する。1873年『生理学的心理学綱要』の前半を出版する。翌1874年、スイスのチューリッヒ大学の哲学の正教授となる。さらに翌1875年ライプツィヒ大学の哲学教授として招かれ、その地に腰をすえる。

  • それまでの哲学的な心理学とは異なる実証的な心理学を構想し、実験心理学最初の書である「感覚知覚説貢献」(1858-1862)を著し、ライプツィヒ大学の哲学教授を務めていた1879年には、世界でももっとも初期の実験心理学の研究室を運用したと言われており、心理学史の多くではこの時をもって、" 新しい学問分野として心理学が成立 " したとされている。その実験室にはヨーロッパ、アメリカ、日本から多くの研究者が集まることになった。1881年には『哲学研究』という名の冊子を発刊し、これは後に『心理学研究』と改称され継続。ヴントの心理学研究室での成果を中心とした諸論文を掲載し、心理学の発展に寄与した。

  • 実験室のあるライプツィヒ以外の地に移住することはなく、その地にて88歳で死去した。生涯に書いた著作のページ数の総計は5万ページ以上だと言われている。

メトロノームを使った実験をおこない、感情の三次元説を展開した。意識的感情は快と不快、弛緩と緊張、鎮静と興奮に沿って変化すると結論づけた。

  • 心理学は経験科学であるとし、形而上学を攻撃した。心理学は直接経験の学であると論じている。心理学と物的科学の差別は経験を眺める見地にあるのであって、扱う「経験」の定義そのものが違うのではないとした。そこで心理学の研究法は自己観察(内観)にあるとした。しかし、彼は二元論者であり、精神と肉体は別物、並行して存在する物とした(精神物理的並行)。

  • また、心理学の目標は、心を簡単に分析して、それらの質から成り立っている各種の形式を決定することであると述べた。つまり、自分の精神の内面を観察する内観という方法を用いて意識を観察・分析し、意識の要素と構成法則を明らかにしようとしたのだ。ゆえに、ヴントの心理学は要素主義と呼ばれる。さまざまな感覚(心的要素の働き)が統覚によって統合されるとした。

  • ヴントの残した足跡からの実験的方法は今日まで発展を続けているが、後の学派、ゲシュタルト心理学行動主義心理学から反発を受けることになる。

  • またハイマン・シュタインタールやモーリツ・ラーツァルスと共に「民族心理学」を創始したとも評価されている。 

アメリカの心理学への影響アメリカ心理学の祖はウィリアム・ジェームズ(1842-1910)で、ヴントがライプツィヒに移った1875年にはすでに生理学心理学の講義を始めていた。ジェームズは実験家ではなかったが、ドイツの実験的手法をアメリカに移入するとともに「人間の行動は環境に対する適応の問題であり、意識は新しい環境に対する調整作用である。」(『心理学原理』(1890年))など、心の機能的意味を強調することで、アメリカ的色彩を生んだのである。

アメリカの学生は多くがヴントの下で学び、帰米して、各地方に実験場を開設した。それで表面上はドイツ的であったが、内容はヴントよりむしろフランシス・ゴールトンに近いものであった。

東北大学のヴント文庫東北大学教授千葉胤成は、ドイツ留学中に丁度売りに出されていたヴントの蔵書を購入し、日本に持ち帰った。この蔵書は東北大学図書館に「ヴント文庫」として所蔵されている。

正直、決して明るい側面の話ばかりじゃないけど、だからこそきっちり振り返らないといけないんですね。