上限付きデータ、または打ち切りデータ

上限付きデータ、または打ち切りデータの元の分布のパラメータ推定において、生存時間解析が行われるが、最適化問題として素直に捉えることもできる。
打ち切りの原因となる上限の分布は、元の分布と独立ならば推定に影響しない。
元の分布が正規分布なら、最尤確率関数の非線形最適化で平均と標準偏差を推定可能である。
元の分布が指数分布なら、同様の方法で解析的に解ける。実現値をXiとすると、推定平均はΣXi/(n-m)である。nはデータ数で、mは打ち切りのデータ数。
正規分布と指数分布では、最尤確率関数の構成が微妙に異なる。


平均aの一様乱数のn個の実現値Xiからaを推定するには、通常、平均(a=ΣXi/n)を使う。他にもm=max(Xi)として、a=m*(n+1)/n/2でも平均を推定できる。最大値を使った推定は、 n個の数値の内の1個しか用いないので、通常の平均より精度が悪そうだが、逆によい。