“確率”の定義

2007年5月11日

  • 情報技術研究所 小倉正美
確率は、不確かさを量的に表現するための手段であり、とかく不確実な現代社会において、今やなくてはならない存在である。しかし、その一方で、不確かさを扱うがゆえの“ある困難”をともなっている。

そもそも確率(Probability)とは「確からしさをあらわす率」であり、P=n/Nのような比率であたえられる。そして、これら分子nと分母Nに何をもってくるかで、2つの定義が存在する。

ひとつは「場合の数」、すなわち、N=起こりうる場合の総数、n=ある事柄が起る場合の数、をあてがうものである。事前に、起る事柄がすべてわかる場合に計算できることから「先験確率」とよばれる。この定義は、個々の場合の、等確率性(起こる確率が等しい)と無相関性(お互いに無関係に起きる)、という2つの条件を前提に成り立つ(※1)

しかし、この定義には問題がある。確率を定義するのに、等確率という確率を前提としていて論理が循環している。さらに、等確率になる根拠がない。むしろ逆に、根拠がない=いずれの場合を優先させる基準がない、ということで“等しい”としている(理由不十分の原則)。これは、はなはだ主観的な対応であり、客観性をモットーとする科学とはいえない。

これに対し、もうひとつの定義が存在する。Nとnに、実際に観測した件数、すなわちN=観測した総件数、n=事柄を観測した件数、を用いるのである。観測という経験にもとづくことから「経験確率」とよばれる(起った件数=頻度を使うことから「頻度確率」ともよばれる)。観測データから帰納的に定義することで、客観性が保証される。

しかし、この定義にも前提がつく。個々の観測がランダム(無作為)におこなわれている、という前提である。ランダムにサンプルを抽出することで、等確率性と無相関性を保証しようとしている。しかし、前提のランダム性は、どうやって保証すればいいのだろうか。結局、この定義も、ランダム性の保証という形で、先験確率と同じ困難を相変わらず引きずっている。

このように「確率をいかに定義するか」ひいては「確率とは何か」という問いに対する明確な答えは、残念ながら、存在しない。その都度、データと対話しながら、答えを模索するしかない。統計学が「技術ではなくアート」といわれる所以である。

ちなみ、この定義をめぐる困難さは、確率論(統計学と表裏一体をなす数学の一分野)にとって困難ではないのだろうか。実は、確率論では、確率を「無定義語」とすることで、困難を回避している。確率の定義=確率の意味を明らかにすること自体を放棄するのである。そもそも数学とは、公理という基本設定をおき、演繹操作(定理と証明)を繰り返すことで、公理か言えること(定理)を整理する学問である。確率論も然りで、確率の性質(有限測度性=0以上1以下の量、加法性=無相関な事柄が起る確率は個々の確率の単純和)を公理にして、論理的に組み立てられた理論体系である。ようするに、確率をどう定義しデータからどう数値化するか、という現実問題は、専ら、統計学に任せられているのである。

(※1)個々の場合が無相関のとき、ある事柄が起こる確率は個々の確率の単純な和になる。個々の確率が等確率のとき、その確率をp、起こりうるすべての場合の数をNとすると、p×N=1、すなわちp=1/Nとなる。一方、ある事柄起こる場合の数をnとすると、ある事柄が起る確率Pは、P=p×n=1/N×n=n /Nとなる。

このコンテンツの著作権は、株式会社大和総研に帰属します。著作権法上、転載、翻案、翻訳、要約等は、大和総研の許諾が必要です。大和総研の許諾がない転載、翻案、翻訳、要約、および法令に従わない引用等は、違法行為です。著作権侵害等の行為には、法的手続きを行うこともあります。

お気に入りへ登録

この記事を「お気に入りレポート」に登録しておくことができます。

このレポートのURLを転送する

  • @

最新コラム