さっきRSSでどこかの速報をつかまえたのですが、西武園ゆうえんちは月内に再開するんだそうです。
先月、火事騒ぎがあってから閉まっていたんですよね。
ここは夏のプールの売上が心配されていたし、近隣に住む人たちにとっては8月の週末の花火が気になっていたものでした。
ちょっとメモ書きに近いですが、統計分布やらなにやらの概念を一般化するのに統計多様体というのがあるんだとか。計算統計学とかの分野みたいで、ディープラーニングの理論もこの先の方にあるんだとかないんだとか。
まぁ、ここまで来ると統計変数からなる多様体に計量やら曲率やらが入っくるみたいで。
正規分布の非線形変換とかいうような次元の話ではないな。
多様体までは行きませんが、確率密度関数の概念は次みたいに一般化できるみたいで。
ええっと、今月号の数理科学にあった内容とかググった内容の抜粋です。
標本空間 $\Omega$ の確率変数 $x$ と、平均とか分散なんかのパラメーターをひとまとめにした $\xi = \{\xi^1, \xi^2, \dots, \xi^n\}$ を考えます。このとき確率分布 $p(x;\xi)$ のあつまり $S = \{p(x;\xi)\}$ を統計モデルというんだそうです。 $\xi$ の右肩の数字は累乗の意味ではなくてインデックスのことです。一般相対論でも上付きの添字と下付きの添字とか使いますね。 $x, \xi$ なんかを局所座標系、 $S$ を多様体とみなすことができると。ここに幾何的構造を考えたときのRiemann計量のうちのひとつにFisher計量というのが定義できるみたいです。その中で接続やらテンソル場とかが定義できるんだと。
正規分布の期待値の式 $$ \int_{-\infty}^{\infty} \frac{1}{\sqrt{2\pi\sigma^2}} e^{-\frac{(x-\mu)^2}{2\sigma^2}} $$ を一般化して、 $\mathcal{P}(\Omega)$ を標本空間 $\Omega$ 上の正値関数全体として、 $S \subset \mathcal{P}$ を統計モデルとしたときに、 $$\int_\Omega p(x;\xi)dx=1$$ となるようと考えると。
正規分布のときはこの式は $$p(x;\mu,\sigma^2)=\int_{-\infty}^{\infty} \frac{1}{\sqrt{2\pi\sigma^2}} e^{-\frac{(x-\mu)^2}{2\sigma^2}} $$
確率密度の式をパラメーターで微分してみて、 $$ 0 = \frac{\partial}{\partial\mu}\int_{-\infty}^{\infty}p(x;\mu,\sigma^2)dx = \int_{-\infty}^{\infty}(x-\mu)p(x;\mu,\sigma^2)dx$$ $$ 0 = \frac{\partial}{\partial\sigma}\int_{-\infty}^{\infty}p(x;\mu,\sigma^2)dx = \int_{-\infty}^{\infty}\left\{\frac{(x-\mu)^2-\sigma^2}{\sigma^3}\right\}p(x;\mu,\sigma^2)dx$$
これから、 $$ E_p[X] = \mu, E_p[(X-\mu)^2]=\sigma^2 $$ となるみたいで、これはいわゆる平均の式と分散の式ですね。
あとはこれを元に色々と調べていかなきゃ。
はうん。
でも、計量があたえられれば距離が計算できるから、マハラノビス距離の一般化もできるということだな。それは結構でかい。マハラノビス距離はユークリッド距離だけど、リーマン空間内の距離が計量で計算できるから。