アルファベット X={1,2,3} 上の確率分布 p1 と p2 を以下のように定める:
p1(1)=1,p1(2)=0,p1(3)=0,p2(1)=0,p2(2)=b,p2(3)=1−b
ただし,b∈(0,1) を定数とする。p1 と p2 の重み付き平均で表される確率分布 q のうち,X 上の一様分布 u とのKullback-Leiblerダイバージェンス
D(u∣∣q)=x∈X∑u(x)logq(x)u(x)
が最小となるものを求めよ。
アルファベット X={1,2,3} 上の確率分布 q は、p1 と p2 の重み付き平均として q(x)=αp1(x)+(1−α)p2(x) で表される。ここで、α∈[0,1] である。一様分布 u とのKLダイバージェンス D(u∥q) を最小化する α を求める。
p1 と p2 の定義より:
q(1)q(2)q(3)=α⋅1+(1−α)⋅0=α,=α⋅0+(1−α)⋅b=(1−α)b,=α⋅0+(1−α)⋅(1−b)=(1−α)(1−b).
一様分布 u(x)=31 に対するKLダイバージェンスは:
D(u∥q)=31x∈X∑logq(x)1/3=−log3−31x∈X∑logq(x).
これを最小化するには、∑x∈Xlogq(x) を最大化すればよい。具体的には:
log(α⋅(1−α)b⋅(1−α)(1−b))=log(α(1−α)2b(1−b)).
定数 b(1−b) を無視すると、最大化対象は α(1−α)2 となる。
関数 f(α)=α(1−α)2 の微分は:
f′(α)=(1−α)2−2α(1−α)=(1−α)(1−3α).
f′(α)=0 の解は α=1/3 または α=1。区間 [0,1] での最大値は α=1/3 で達成され:
f(1/3)=31(32)2=274.
α=1/3 を代入すると:
q(1)q(2)q(3)=31,=32b,=32(1−b).
答え:
q(1)=31,q(2)=32b,q(3)=32(1−b).