Statistiken har Guinness att tacka för studentens t-test. Kredit:Flickr/Scott Thompson, CC BY
Denna St Patrick's Day, frossare runt om i världen kommer att trängas på gatorna och leta efter en av Irlands nationella drinkar:en pint Guinness. Men förutom denna välsmakande stout, ett av de mest grundläggande och vanligt förekommande vetenskapliga verktygen har också sitt ursprung på Guinness bryggeri.
Mot slutet av 1800-talet, Guinness skalade upp sin verksamhet, och var intresserad av att tillämpa ett vetenskapligt förhållningssätt till alla aspekter av Guinness produktion:från korntillväxt ända fram till Guinness smak.
Innan man antar ett vetenskapligt tillvägagångssätt, bryggare på Guinness förlitade sig på subjektiva metoder, som utseendet och doften av humle, för att bedöma produktkvaliteten.
Vetenskap i bryggan
När väl vetenskapliga bryggare rekryterades, ett mer objektivt förhållningssätt togs. Den första vetenskapliga bryggaren, Thomas Bennett Fall, anställdes 1893 och han trodde att mängden mjuka hartser i humle var relaterad till Guinness kvalitet. Han var därför angelägen om att uppskatta mängden mjukt harts i särskilt humlegrödor.
Utmaningen inför Case var att han, som vilken vetenskapsman som helst, kunde inte mäta allt på en gång. Det var inte möjligt för honom att bedöma mängden mjukt harts i varenda en av de otaliga humleblommorna (tillagda av tusentals till enorma kärl av snart-Guinness) i hans laddning.
Istället, han tog ett humleprov (11 mått på 50 gram vardera) och beräknade den genomsnittliga mjukhartshalten. Hans förhoppning var att den genomsnittliga mjuka hartshalten i hans lilla prov skulle kunna användas för att uppskatta mjukt hartsinnehåll i hela grödan (vad statistiker skulle kalla "befolkningen") av humle.
För jämförelse, en kollega tog ytterligare 14 mätningar om 50 gram vardera från samma parti humle. Case fann en liten skillnad i den genomsnittliga mängden mjuka hartser mellan dessa prover.
Han var förkyld. Beror dessa skillnader i humleinnehåll på verkliga skillnader över hela humleskörden, eller berodde de på slumpmässiga fel som introducerades genom att använda små urvalsstorlekar?
Storlek spelar roll
Just då, statistik förlitade sig på vad som kallas "stort urvalsteori", vilket föga överraskande kräver stora prover (150 eller fler) för att fungera. Att tillämpa den på problem med små prover (som de som Case at Guinness ställs inför) var svårt.
Detta var problemet som William Sealy Gosset, en nyutexaminerad kemi och matematik vid Oxford University, var angelägen om att ta upp. Gosset började arbeta som bryggerärling på Guinness-fabriken i Dublin 1899.
1906, Gosset, nu en självlärd statistiker, gick för att studera med Karl Pearson, en ledande figur inom statistik, vid University College London.
Gosset var angelägen om att anpassa Pearsons stora provmetoder för att hantera de små prover de använde på Guinness. Där, han utvecklade sina idéer och gjorde dem redo för publicering.
Dock, fram till slutet av 1930-talet, Guinness skulle inte tillåta anställda att publicera under sina egna namn av rädsla för att andra bryggare skulle lära sig om deras vetenskapliga förhållningssätt till öl. Som ett resultat, Gosset publicerade sin viktigaste tidning, Det troliga felet i ett medelvärde, under pseudonymen "Student" i tidskriften Biometrika 1908.
Detta var ursprunget till Students t-test, en grundläggande statistisk metod som används i stor utsträckning än idag.
Elevens t-test
Problemet som Case stod inför var att användning av små prover av humle introducerar en ny källa till osäkerhet i analysen, lämnar honom mindre i stånd att skilja mellan verkliga, sanna skillnader mellan två partier humle och skillnader på grund av denna osäkerhet.
Gossets geni var att hitta ett sätt att redovisa detta:t-fördelningen. Detta definierar matematiskt förhållandet mellan urvalets storlek och mängden osäkerhet som detta medför.
I grund och botten, vid experiment, t-distributionen (och det berömda t-testet som beror på det) gör att både ölbryggare och forskare kan redogöra för storleken på provet de har använt i sitt arbete, och sedan definiera hur säkra de är på sina resultat.
Håller med bryggarnas fall, du skulle ha information från de två proverna, såsom den genomsnittliga mjuka hartshalten i humlen och spridningen av varje mätning runt genomsnittet för varje prov.
Utan att gå in på för mycket detaljer, t-testet hjälper till att avgöra om det finns bevis för en skillnad mellan de två genomsnitten baserat på urvalet (dvs. antalet mätningar från en viss humleskörd). I bryggarnas fall letade de efter noll skillnad mellan sina två prover.
Ett bestående arv
Gossets metod väckte inte statistiksamfundets uppmärksamhet förrän en annan ledande statistisk figur, Ronald Aylmer Fisher, entusiastiskt omfamnade metoden och gav ett matematiskt bevis.
Sen den tiden, t-testet har använts för att ta itu med ett stort antal vetenskapliga problem, från bedömning av hjärnans funktion hos strokepatienter, till mätning av kol- och kväveinnehåll i kustnära havslevande bakterier, till hur kolgruvarbetares beteende kan eller inte kan leda till olyckor (konsumtionen av Guinness av dessa gruvarbetare var, kanske överraskande, inte ett fokus för studien).
Faktiskt, Students t-test har använts inom i stort sett alla områden av vetenskaplig strävan:biologi, fysik, psykologi, biometri, ekonomi och medicin.
Det är en stapelvara i grundutbildningsstatistik som lärs ut över dessa discipliner, men få kan vara medvetna om Gossets roll i att skapa t-testet och hans skäl för att göra det.
Gosset stannade på Guinness under hela sitt liv som chef för experimentell bryggare, då chef för statistikavdelningen som han bildade på Guinness, innan han befordrades till Head Brewer för det nya Guinness-bryggeriet i London 1935. Han publicerade flera tidningar som "Student" men hans sanna identitet avslöjades offentligt först efter hans död 1937.
Så, om du dricker en Guinness denna St Patrick's day, höj ett glas till den föga kända karaktären som spelade en central roll i öl, statistik och faktiskt modern vetenskap:William Sealy Gosset.
Denna artikel publicerades ursprungligen på The Conversation. Läs originalartikeln.