猫になりたい

IT企業のデータ分析屋、計量経済とか機械学習をやっています。pyてょnは3.6を使ってマスコレルウィンストングリーン。

確率で出てくるセミコロン( ; )と縦線( | )の違い


スポンサーリンク

以前から確率で出てくるセミコロン( ; )と縦線( | )の違い、例えば p(x ; \theta) p(x | \theta)、が判らずに悩んでいたので調べた。Cross Validatedの解答によると両者の意味合いに大きな違いはない、で良さそうである。*1 ただし  p(x ; \theta) \thetaというパラメータが与えられた下でのp(x)の評価値、  p(x | \theta) \thetaという条件が与えられた下でのp(x)の評価値、 と言う微妙な違いが有るらしい。*2 恐らくは歴史的な背景によるものだろうが詳しくはわからなかった。

だから、データ xが与えられた時の \thetaの確率は  p(\theta | x)と書けるが、 xはパラメータでは無いので p( \theta; x)とは書けない。 逆に、パラメータ \thetaが与えられた時の xの確率は p(x ; \theta)とも書けるし、
条件 \thetaが与えられた下でのxの確率と見做して p(x | \theta) とも書けるということだろう。

実際、ノンパラメトリックベイズ 点過程と統計的機械学習の数理 (機械学習プロフェッショナルシリーズ)には、

確率分布を定義する場合は、確率分布のパラメータを \thetaとして p(x; \theta)などと書きますが、本書では、条件つき確率の形 p(x|\theta)で書くことにします。この理由としては、パラメータも確率変数として扱っているという意味合いが込められています。

に有るのでこの解釈で問題なさそうである。