• Home
  • Kemi
  • Astronomien
  • Energi
  • Naturen
  • Biologi
  • Fysik
  • Elektronik
  •  science >> Vetenskap >  >> Andra
    Matematiker utvecklar en ny statistisk indikator

    Kredit:CC0 Public Domain

    De flesta av oss känner till detta fenomen alltför väl:när det är varmt ute, du känner sugen på en svalkande glass. Men skulle du ha trott att matematik kunde vara inblandat?

    Låt oss förklara:De stigande temperaturerna och den stigande isförbrukningen är två statistiska variabler i linjärt beroende; de är korrelerade.

    I statistiken, korrelationer är viktiga för att förutsäga det framtida beteendet hos variabler. Sådana vetenskapliga prognoser efterfrågas ofta av media, vare sig det gäller fotboll eller valresultat.

    För att mäta linjärt beroende, forskare använder den så kallade korrelationskoefficienten, som först introducerades av den brittiske naturvetaren Sir Francis Galton (1822-1911) på 1870-talet. Kort efteråt, matematikern Karl Pearson gav en formell matematisk motivering för korrelationskoefficienten. Därför, matematiker talar också om "Pearson-produkt-ögonblickskorrelationen" eller "Pearson-korrelationen".

    Om, dock, beroendet mellan variablerna är icke-linjärt, korrelationskoefficienten är inte längre ett lämpligt mått på deras beroende.

    René Schilling, Professor i sannolikhet vid TU Dresden, betonar "Hittills har det har krävts en hel del beräkningsansträngning för att upptäcka beroenden mellan mer än två högdimensionella variabler, i synnerhet när komplicerade icke-linjära samband är inblandade. Vi har nu hittat en effektiv och praktisk lösning på detta problem."

    Dr Björn Böttcher, Prof. Martin Keller-Ressel och Prof. René Schilling från TU Dresdens Institute of Mathematical Stokastics har utvecklat ett beroendemått som kallas "distans multivarians". Definitionen av detta nya mått och den underliggande matematiska teorin publicerades i den ledande internationella tidskriften Annals of Statistics under titeln "Distance Multivariance:New
    Beroendemått för slumpmässiga vektorer."

    Martin Keller-Ressel förklarar:"För att beräkna beroendemåttet, inte bara värdena på de observerade variablerna själva, men även deras inbördes avstånd registreras och från dessa avståndsmatriser, avståndet multivarians beräknas. Detta mellansteg möjliggör upptäckt av komplexa beroenden, vilket den vanliga korrelationskoefficienten helt enkelt skulle ignorera. Vår metod kan appliceras på frågor inom bioinformatik, där stora datamängder behöver analyseras."

    I en uppföljande studie, det visades att den klassiska korrelationskoefficienten och andra kända beroendemått kan återvinnas som gränsfall från avståndsmultivariansen.

    Björn Böttcher avslutar med att påpeka:"Vi tillhandahåller alla nödvändiga funktioner i paketet 'multivians' för den fria statistikmjukvaran R, så att alla berörda parter kan testa tillämpningen av den nya beroendeåtgärden."


    © Vetenskap https://sv.scienceaq.com