Full-beroende-struktur. Kredit:Björn Böttcher
I december, det akademiska förlaget De Gruyter lanserade sin nya tidskrift Öppna statistik med en inledande artikel av TU Dresden-matematikern Dr Björn Böttcher. Artikeln presenterar utvidgningen av det statistiska måttet på distansmultivarians som utvecklats av Böttcher och hans kollegor vid TU Dresden.
Avståndsmultivarians är ett multivariat beroendemått som kan detektera beroenden mellan ett godtyckligt antal slumpmässiga vektorer som var och en kan ha en distinkt dimension. I sin nya artikel, Böttcher presenterar nu konceptet som en förenande teori som kombinerar flera klassiska beroendemått. Samband mellan två eller flera högdimensionella variabler kan fångas och även komplicerade icke-linjära beroenden såväl som beroenden av högre ordning kan upptäckas. För många vetenskapliga discipliner, denna metod öppnar upp för nya metoder för att upptäcka och utvärdera beroenden.
Kan antalet missade skoldagar kopplas till åldern, skolelevers kön eller ursprung? I en undersökning av 146 skolelever, samhällsvetare analyserade olika påverkande variabler på missade skoldagar och undersökte dem för beroenden för att härleda en prediktionsmodell. Denna klassiska fråga har redan diskuterats flitigt och analyserats med olika statistiska tillvägagångssätt.
Det statistiska måttet på avståndsmultivarians presenterar ett nytt tillvägagångssätt för denna fråga:Dr. Björn Böttcher från Institutet för matematisk stokastik kunde använda avståndsmultivarians för att bestämma den kulturella bakgrunden och ett beroende av högre ordning inklusive ålder och kön som påverkande faktorer för de missade skoldagar. Han kunde alltså föreslå en minimal modell. "Detta är ett elementärt exempel för en tillämpning av den utvecklade metoden. Jag kan inte bedöma om detta också är ett underbyggt fynd med hänsyn till den undersökta frågan. Att arbeta med verkliga data och särskilt den ämnesspecifika tolkningen av resultaten kräver alltid expertis i respektive ämne, " Dr. Böttcher säger, och ger många andra illustrativa exempel på tillämpningen av hans metod:"I tidningen, Jag hänvisar till mer än 350 fritt tillgängliga datamängder från alla vetenskapliga discipliner där statistiskt signifikanta beroenden av högre ordning förekommer. På nytt, huruvida dessa beroenden är meningsfulla i termer av de underliggande undersökningarna kräver ytterligare undersökningar samt expertis inom respektive område, " och han tillägger, "självklart, förfrågningar om samarbete är alltid välkomna."
Statistisk analys tar vanligtvis hänsyn till beroenden mellan enskilda variabler. Speciellt med många variabler, det är önskvärt att ta bort oberoende variabler innan man studerar några specifika typer av beroende. Dr. Björn Böttcher presenterar en metod för detta ändamål som kallas "detektering av beroendestruktur, " som också kan användas för att upptäcka beroenden av högre ordning. Variabler kallas "beroende av högre ordning" om de är parvis oberoende, men mer än två variabler påverkar fortfarande varandra gemensamt. Beroende av detta slag har hittills inte varit i fokus för ansökningar.
Vissa forskare misstänker att beroenden av högre ordning förekommer inom genetiken:grundtanken här är att flera gener tillsammans bestämmer en egenskap, men dessa gener visar varken individuellt något beroende sinsemellan eller individuellt med egenskapen - sålunda skulle dessa verkligen vara beroende av högre ordning. Ramverket för multivarians avstånd och metoden för detektering av beroendestruktur är nu lovande verktyg för sådana undersökningar.
Implementeringar av de nya metoderna tillhandahålls för direkta applikationer i paketet "multivians" för den fria statistiska beräkningsmiljön R.