• Home
  • Kemi
  • Astronomien
  • Energi
  • Naturen
  • Biologi
  • Fysik
  • Elektronik
  •  science >> Vetenskap >  >> Andra
    Ny metod för att identifiera symmetrier i data med hjälp av Bayesiansk statistik

    Exempel på färgade grafer som betecknar symmetrier hos fyrdimensionell data:Vertices och kanter av samma färg och form i en graf mappas till varandra genom en symmetripermutation som bevarar datastrukturen. Kredit:Hideyuki Ishi, Osaka Metropolitan University

    En internationell forskargrupp ledd av forskare från Osaka Metropolitan University har utvecklat en metod för att identifiera symmetrier i flerdimensionell data med hjälp av Bayesianska statistiska tekniker.

    Detta statistiska tillvägagångssätt kräver komplexa beräkningar av integraler, som ofta endast betraktas som approximationer. I sin nya studie har forskargruppen framgångsrikt tagit fram nya exakta integralformler. Deras resultat bidrar till att förbättra noggrannheten hos metoder för att identifiera datasymmetrier, och eventuellt utvidga deras tillämpningar till bredare intresseområden, såsom genetisk analys.

    Symmetrier i naturen gör saker vackra; symmetrier i data gör datahanteringen effektiv. Komplexiteten i att identifiera sådana mönster i data har dock alltid förvirrat forskare. Forskare från Osaka Metropolitan University och deras kollegor har tagit ett stort steg mot att upptäcka symmetrier i flerdimensionell data genom att använda Bayesiansk statistik. Deras resultat publicerades i The Annals of Statistics .

    Bayesiansk statistik har varit i rampljuset de senaste åren på grund av förbättringar av datorprestanda och dess potentiella tillämpningar inom artificiell intelligens. Bayesiansk statistik är ett statistiskt tillvägagångssätt som, även när data är otillräckliga, härleder sannolikheten för att en händelse inträffar genom att först ställa in en tidigare sannolikhet och sedan, närhelst ny information erhålls, beräkna en posterior sannolikhet – en uppdatering av den tidigare sannolikheten – att händelsen kommer att inträffa. Beräkningen av posteriora sannolikheter kräver komplexa beräkningar av integraler och anses därför ofta endast vara en approximation.

    Det internationella teamet inklusive professor Hideyuki Ishi från Osaka Metropolitan University, professor Piotr Graczyk från University of Angers, professor Bartosz Kołodziejek från Warszawas tekniska universitet och den avlidne professorn Hélène Massam från York University (Toronto) har lyckats härleda nya exakta integralformler , och att utveckla en metod för att söka efter symmetrier i flerdimensionell data med hjälp av Bayesianska statistiska tekniker.

    När mängden data som ska hanteras ökar måste det optimala mönstret väljas från ett stort antal mönster, vilket gör det svårt att lösa problemet exakt. För att möta denna utmaning har teamet också utvecklat en effektiv algoritm för att få en ungefärlig lösning även i sådana fall.

    Med professor Ishis ord, "Symmetrier i data är allestädes närvarande i en mängd olika modeller. När väl symmetrier har identifierats kan antalet parametrar som krävs för att visa strukturen på datan och antalet prover som krävs för att bestämma parametrarna, minskas avsevärt. I framtiden förväntas resultaten av denna forskning bidra till genetisk analys, upptäcka kromosomer som har samma funktion på olika platser." + Utforska vidare

    Bayesianskt modellval visar extremt polariserat beteende när modellerna har fel




    © Vetenskap https://sv.scienceaq.com