【自然対数eとの邂逅】生涯の伴侶選びの規準「4人/37人/368人目からが本番」ルールとは？

この世界には「お見合い/結婚問題(marriage problem)」あるいは「秘書問題（secretary problem）」「スルタンの持参金問題 (sultan's dowry problem)」「最良選択問題(best choice problem) 」など呼ばれる恐るべき数学的課題が存在します。

もし人生で n 人の異性と付き合うことが分かっていて n が十分大きいなら，最初の n/e 人とは別れ、その後で「今までで一番いい人」がいたら結婚するべきである。
＊ここでいうeはネイピア数（2.718⋯）

数学的設定

現実的でない仮定もあるがご容赦の程を。

n 人と順番に出会う。

出会った瞬間に交際するかしないか決めないといけない。

交際を申し込めば相手はOKしてくれる。

交際をスタートしたら他の人とは二度と出会えない。

一回断った人とは二度と交際できない。

こうした制約下、n 人の中で一番タイプな人と交際できる確率を最大にしたい。ここではとりあえず直感的に自然な「最適停止戦略（Optimum stop strategy）」を採用する。

k 人目まで無条件で断る。

k+1 人目以降で「今までで一番いい人」が現れたら交際する。

するとn が十分大きいとき， k=n/e （付近）に最適解が現れる。このとき，n 人の中で一番タイプな人と交際できる確率は約 37 %（1/e）となる。

なお、n が必要に満たないほど小さな人にはこの理論は通用しない。

それではコンピューター上でのシミュレーションを試みます。

#統計言語Rでの作図例
＊アルゴリズムは以下を参照の事。

#n人の応募者に対して、何人目まで応募者を見て、選び始めるべきなのかをtry_cnt回試行した確率でシミュレートする。

try_cnt <- 10000
# 人数
n <- 100
# 伴侶
pertner <- numeric(n)
# 確率分布
prob <- numeric(n)

# jは見る人数
for(j in 1:(n-1)){
success <- 0
for(i in 1:try_cnt){
# ランダムに優先度割付
pertner <- sample(1:n,n)
# 基準値
criterion_max <- 0
# 成功数カウント
excel_cnt <- 0
for(k in 1:j){
if(criterion_max <pertner[k]){
criterion_max <-pertner[k]
}
}
for(l in (j+1):n){
if(criterion_max <pertner[l]){
excel_cnt <- excel_cnt + 1
criterion_max <-pertner[l]
}
}
if(excel_cnt == 1){
success <- success + 1
}
}
prob[j] <- success / try_cnt
}
# 確率分布に行番号付与
rownum <- 1:n
distribution <- cbind(rownum,prob)
# グラフにプロット
plot(distribution,type="h",main="Best_Choice_Problem")

f:id:ochimusha01:20190321230109p:plain

こうして「生涯で最も適切な伴侶を選ぶには、候補に100人出会うとして36人目まで見てから決めるのが最適」という「（10人中の）4人目（100人中の）37人目（1000人中の）368人目からが本番」ルールが証明された訳ですが…

【婚活】36.8％の法則！結婚は何人目でするのが一番良い？ - NAVER まとめ

第一の点は、〈数学の概念は、まったく予想外のさまざまな文脈のなかに登場してくる〉ということ。
The first point is that mathematical concepts turn up in entirely unexpected connections.

しかも、予想もしなかった文脈に、予想もしなかったほどぴったりと当てはまって、正確に現象を記述してくれることが多いのだ。
Moreover, they often permit an unexpectedly close and accurate description of the phenomena in these connections.

第二の点は、予想外の文脈に現れるということと、そしてまた、数学がこれほど役立つ理由を私たちが理解していないことのせいで、〈数学の概念を駆使して、なにか一つの理論が定式化できたとしても、それが唯一の適切な理論なのかどうかがわからない〉ということ。
Secondly, just because of this circumstance, and because we do not understand the reasons of their usefulness, we cannot know whether a theory formulated in terms of mathematical concepts is uniquely appropriate.

〔この二つの論点をさらに言い直すと〕第一の点は〈数学は自然科学のなかで、ほとんど神秘的なまでに、途方もなく役立っているのに、そのことには何の合理的説明もない〉ということ。
The first point is that the enormous usefulness of mathematics in the natural sciences is something bordering on the mysterious and that there is no rational explanation for it.

第二の点は〈数学の概念の、まさにこの奇怪な有用性のせいで、物理学の理論の一意性が疑わしく思えてしまう〉ということ。
Second, it is just this uncanny usefulness of mathematical concepts that raises the question of the uniqueness of our physical theories.

既に気付いている人も少なくないかもしれないが、実はこの計算式（(1/N)^N）における最適値（1/e＝0.3678794⋯）の求め方自体は、自然対数（natural logarithm）確証方法として「ベルヌーイの思考実験」すなわち「複利計算式（(1+1/N)^N）における元本増加率（e=2.718281…）の求め方」のバリエーションに過ぎない。
ここで浮上してくる問題が２つ。「生涯のうちに出会う伴侶候補の人数が臨終の瞬間まで確定しない」そして「そもそも誰もがこのアルゴリズムが有効となるほど伴侶候補と出会うとは限らない」。そもそも「Nが十分に大きい時」という言い回しに隠された残酷さ。人によっては368人目や37人目どころか4人目も怪しいというのに…
＊まぁ複利式計算における２年目以降の動作も同じくらい怪しい訳ではあるが。「ちょっと奥さん、なんと貴方の預けた資産がたったX年で約XXX倍に!! そりゃやるでしょ!? やるなら今でしょ!?」

で、現実世界に目を向けるとこんな話が。

秘書問題（secretary problem） - Wikipedia

心理学や実験経済学では、秘書問題を実際の人間を使って実験し研究してきたが、多くの場合、人はあまりにも早く決定を下すという結果が示されている。

これは対象を評価するコストがその理由の一部と考えられる。実世界に適用して考えてみると、人間は逐次的に判断を下す必要のある場面で十分に検討しない可能性があることを示唆している。例えば、車を運転していて給油しなければならない状況で、よく検討せずにガソリンスタンドを決める場合などが考えられる。すると、人はもっと慎重なら安いガソリンを給油できたかもしれない状況で、余分に出費している傾向があることになる。同じことは、例えばオンラインで安い航空チケットを探している場合などが考えられる。秘書問題などの問題についての実験的研究は behavioral operations research の領域とされる。

またStein, Seale, and Rapoport（2003年）では、秘書問題を解く際に使われる心理学的にもっともらしいヒューリスティクスの成功確率を検討している。

ヒューリスティクス（英heuristic, 独Heuristik） - Wikipedia

ヒューリスティックとは、必ず正しい答えを導けるわけではないが、ある程度のレベルで正解に近い解を得ることができる方法。答えの精度が保証されない代わりに、回答に至るまでの時間が少ない。主に計算機科学と心理学の分野で使用される言葉であり、どちらの分野での用法も根本的な意味は同じであるが、指示対象が異なる。すなわち、計算機科学ではプログラミングの方法を指すが、心理学では人間の思考方法を指すものとして使われる。なお、論理学では仮説形成法と呼ばれている。

計算機科学におけるヒューリスティクス

コンピューターに計算やシミュレーションを実行させるときに、ヒューリスティックを用いることがある。たいていの計算は、計算結果の正しさが保証されるアルゴリズムか、または計算結果が間違っているかもしれないが誤差がある範囲内に収まっていることが保証されている近似アルゴリズムを用いて計算する。しかし、そのような方法だと、計算時間が爆発的に増加してしまうようなことがある。

そのような場合に、妥協策としてヒューリスティックを用いる。ヒューリスティックは、精度の保証はないが、平均的には近似アルゴリズムより解の精度が高い。また、ヒューリスティックの中でも、任意の問題に対応するように設計されたものは、メタヒューリスティックという。

ヒューリスティックな仮定

アルゴリズムの近似精度や実行時間を評価したいが、真面目に評価するのが困難な場合、アドホックな仮定（妥当な仮定に見えるものの、その正しさを証明できないような、その場しのぎの仮定）をおいて評価を行うことが多い。こうした仮定のことを「ヒューリスティックな仮定」と呼ぶ。

アンチウイルスソフトウェア近年のアンチウイルスソフトウェアでは、ヒューリスティックエンジンを搭載したものが増加してきている。また、フリーソフトにも搭載されており、その進展を見せている。ただし、個々のソフトのヒューリスティック機能は同じでも、その仕組みは異なっているものが多い。

心理学心理学におけるヒューリスティック

人が複雑な問題解決などのために、何らかの意思決定を行うときに、暗黙のうちに用いている簡便な解法や法則のことを指す。これらは、経験に基づくため、経験則と同義で扱われる。判断に至る時間は早いが、必ずしもそれが正しいわけではなく、判断結果に一定の偏り（バイアス）を含んでいることが多い。なお、ヒューリスティックの使用によって生まれている認識上の偏りを、「認知バイアス」と呼ぶ。

利用可能性ヒューリスティック（availability heuristic）、想起ヒューリスティック

想起しやすい事柄や事項を優先して評価しやすい意思決定プロセスのことをいう。英語の訳語である検索容易性という言葉の示す通りのヒューリスティックである。

代表性ヒューリスティック（representative heuristic）

特定のカテゴリーに典型的と思われる事項の確率を過大に評価しやすい意思決定プロセスをいう。代表的な例として、「リンダ問題」がある。

係留と調整（anchoring and adjustment）

最初に与えられた情報を基準として、それに調整を加えることで判断し、最初の情報に現れた特定の特徴を極端に重視しやすい意思決定プロセスをいう。

彼らが検討したヒューリスティクスは以下のようなもので、いずれもyなるパラメータが存在し、英語版ではn=80の時にこの値を変化させている。それぞれの最善選択確率を計算した結果によると、CRが最も確率が高く、次が SNCR で、CCR が一番確率が低かったという。