úterý 24. dubna 2012

Kurt Gödel a Nassim Taleb

Nassim Taleb má poněkud nepříjemný sloh pro ty, kteří mají raději věcnost a skromnost. V Černé labuti zmiňuje Taleb věty o neúplnosti Kurta Gödela. Nezapomíná ovšem podotknout, že výsledky jeho zkoumání Gödela předstihují. To je poněkud přehnané, ale neznamená to, že „Telebova věta o nerozhodnutelnosti“ nemá pravdu. Má.

Raphael Douady and I re-expressed the philosophical problem mathematically, and it appears vastly more devastating in its implication than the Gödel problem. At the time of writing, we produced a formal proof using mathematics, and a branch of mathematics called “measure theory” that was used by the French to put rigor behind mathematics of probability. The paper is temporarily called Undecidability theorem of probabilistic measures: On the inconsistency of estimating probabilites from a sample without binding a priori assumptions on the class of acceptable probabilities.
 Nassim Taleb - The Black Swan

Taleb by mi asi neodpustil, že používám Gaussovo rozdělení pravděpodobnosti (neboli jak Taleb říká velký intelektuální podvod – zkr. VIP), ale je to jen pro důkaz. Nepochybuji, že Talebův a Doudyho důkaz je brilantní a geniální, ale můj důkaz je prosťoučký a krátký, a proto ho tady sepíši:

Tvrzení: Máme-li neprázdnou konečnou množinu bodů M={xi; i=1,...,n}, pak ke každé hustotě pravděpodobnosti p existuje rozdělení hustoty pravděpodobnosti p’ takové, že platí:

Πi p(xi) < Πi p‘(xi).

Jinými slovy: úloha nalezení nejvěrohodnějšího pravděpodobnostního modelu k jakýmkoli datům nemá řešení.

Důkaz: Zvolme si

p’(x) = 0.5 N(x, x1, 1) + 0.5 N(x, x1, σ2),

kde N(x, μ, σ2) je normální rozdělení proměnné x se střední hodnotou μ a variancí σ2. Platí

limσ2 → 0 Πi p‘(xi) ≥ (Πi > 1 0.5 N(xi, x1, 1)) 0.5 limσ2 → 0 N(x1, x1, σ2).

A protože konstanta

i > 1 0.5 N(xi, x1, 1)) 0.5 > 0

 a očividně platí

limσ2 → 0 N(x1, x1, σ2) = +∞,

musí platit

limσ2 → 0 Πi p‘(xi) ≥ +∞,

a tedy

limσ2 → 0 Πi p‘(xi) = +∞.

Můžeme tedy věrohodnost p’ zvyšovat nad každou mez, což mělo být dokázáno.

Ještě poznámku: Mohlo by se zdát, že sice nemůžeme dospět k vrcholu, ale že máme dobrý směr k dobrému řešení. Právě naopak. Toto sklouznutí do pólu věrohodnostní funkce, tak, jak je to ukázáno v důkazu, je tzv. kolaps statistické metody maximální věrohodnosti a je nutné se mu vyhnout.

3 komentáře:

Radoslav Harman řekl(a)...

Každému, kto čo i len trochu rozumie metóde maximálnej vierohodnosti, je úplne jasné, že pre konečný náhodný výber neexistuje najvierohodnejší odhad v triede všetkých hustôt; žiadny normálny štatistik nikdy netvrdil opak a nikdy nechcel metódu maximálnej vierohodnosti takýmto spôsobom používať. Navyše, dôkaz tohto tvrdenia nepresahuje úroveň jednoduchého cvičenia zo základov matematickej štatistiky.

Táto banalita nemá najmenší dopad na matematickú štatistiku a tvrdiť, že je to fundamentálnejšie tvrdenie ako Goedelove vety hraničí s psychickou poruchou. Black Swan som čítal a trvám na tom, že Taleb je nafúkaný táraj.

Giovanni řekl(a)...

Omlouvám se, že jsem to neřekl naplno, ale jen v ironii. Uvedeným důkazem jsem chtěl říct přesně to, že je to velmi jednoduché tvrzení, který by měl zvládnout dokázat každý schopnější středoškolák. Nadto je obecně známé a Taleb ho nevymyslel. Nevím přesně, jaký je význam slova "táraj", ale mám pocit, že to sedí.

Radoslav Harman řekl(a)...

Tak teda ja sa ospravedlňujem, že som nepochopil tú iróniu :) Ono totiž ten Taleb to evidentne myslí vážne...