I statistik används Gaussisk eller normal distribution för att karakterisera komplexa system med många faktorer. Som beskrivet i Stephen Stiglers statistikhistoria, uppfann Abraham De Moivre den distribution som bär Karl Fredrick Gauss namn. Gauss bidrag låg i hans tillämpning av fördelningen till minsta kvadreringsmetoden för att minimera felet i monteringsdata med en linje med bästa passform. Han gjorde sålunda den viktigaste felfördelningen i statistik.
Motivation
Vad är fördelningen av ett urval av data? Vad händer om du inte känner till dataens underliggande distribution? Finns det något sätt att testa hypoteser om data utan att känna till den underliggande distributionen? Tack vare Central Limit Theorem är svaret ja.
Statsens stämning
Det står att ett provmedel från en oändlig befolkning är ungefär normal eller Gaussisk, med i stort sett densamma som den underliggande befolkningen och variansen lika med befolkningsvariationen dividerad med provstorleken. Tillnärmningen förbättras då provstorleken blir stor.
Tillnärmningsberäkningen är ibland felaktig som en slutsats om konvergens till en normal fördelning. Eftersom den approximativa normalförändringen ändras när provstorleken ökar är ett sådant uttalande vilseledande.
Statsen har utvecklats av Pierre Simon Laplace.
Varför är det överallt
Normalfördelningar är allestädes närvarande. Anledningen kommer från Central Limit Theorem. Ofta när ett värde mäts är det summan av många oberoende variabler. Därför har värdet som mäts själv har en provmåttlig kvalitet för den. En distribution av idrottsutövare kan till exempel ha en klockform, som ett resultat av skillnader i kost, träning, genetik, coaching och psykologi. Även männens höjder har en normal fördelning, som är en funktion av många biologiska faktorer.
Gaussian Copulas
Vad kallas en "copula-funktion" med en gaussfördelning var i nyheterna 2009 på grund av dess användning vid bedömning av risken att investera i säkerställda obligationer. Misstaget av funktionen var medverkande i finanskrisen 2008-2009. Även om det fanns många orsaker till krisen, skulle det i framtiden inte ha varit använt Gaussfördelningar i efterhand. En funktion med en tjockare svans skulle ha fått större sannolikhet för biverkningar.
Derivation
Centralgränsteoretiken kan bevisas i många linjer genom att analysera momentgenereringsfunktionen (mgf) av (prov medelvärdet - populationens medelvärde) /? (populationsvariation /provstorlek) som en funktion av den underliggande populationens mgf. Den approximativa delen av teorin introduceras genom att expandera den underliggande befolkningens mgf som en kraftserie, då visar de flesta termerna obetydlig då provstorleken blir stor.
Det kan bevisas på mycket färre linjer med hjälp av en Taylor expansionen på den karaktäristiska ekvationen för samma funktion och gör provstorleken stor.
Beräkningsmodell
Vissa statistiska modeller antar att felen är gaussiska. Detta möjliggör fördelningar av funktioner av normala variabler, som chi-kvadrat- och F-fördelningen, som ska användas vid hypotesprovning. Specifikt, i F-testet består F-statistiken av ett förhållande av chi-kvadratfördelningar, vilka själva är funktioner av en normal variansparameter. Förhållandet mellan de två orsakar variansen att avbryta, vilket möjliggör hypotesprovning utan kunskap om avvikelser bortsett från deras normalitet och konstantitet.