Upprepningsdiagrammet är ett viktigt verktyg för att analysera olinjära dynamiska system, särskilt system som innefattar empiriskt observerade tidsseriedata. RP visar mönster i ett fasrymdsystem och anger var data besöker samma koordinater. RP kan också efterlikna vissa typer av inferentiell statistik och linjära analyser, såsom spektralanalys. Ett nytt papper i tidningen Kaos , ger ett bevis på konceptet för att använda RP för att efterlikna Kolmogorov-Smirnov-testet, som forskare använder för att avgöra om två datamängder skiljer sig väsentligt åt.
Författarna, dock, var försiktig så att inte alla typer av data kan användas med denna nya metod. "Kontinuerliga data med en intervall- eller kvotnivå är bäst lämpade för denna teknik, "sa Giuseppe Leonardi, en av studiens författare. "Dock, diskret distribuerad data på samma mätnivå som tärningskast skulle också vara lämplig. "
Forskarna analyserade återkommande punkter i RP genom att dela RP i fyra kvadranter och räkna antalet återkommande punkter i varje cell. Sedan, de beräknade frekvensen inom urvalet och mellan urvalet och använde dessa värden, tillsammans med förväntade frekvenser, för att bestämma ett p-värde relaterat till skillnaden mellan proverna. Detta p-värde indikerade om de två grupperna var från samma prov eller från olika prover.
För att verifiera deras bevis på koncept, forskarna genomförde en serie simuleringar för att se hur deras återkommande baserade test utfördes jämfört med Kolmogorov-Smirnov-testet. Dessa simuleringar involverade två grupper av normala, skev normal, eller log-normalfördelningar med olika kombinationer av medel och standardavvikelser. Forskarna fann att den recidivbaserade metoden utförde ungefär samma som Kolmogorov-Smirnov-testet med några skillnader i känslighet med olika distributionstyper.
Det återkommande testet tycktes vara mer känsligt vid fördelningens svansar än Kolmogorov-Smirnov-testet. Detta kan bero på att testet tar hänsyn till avvikelser längs hela värdena, till skillnad från Kolmogorov-Smirnov-testet som bara står för den största avvikelsen mellan två fördelningar. Leonardi förklarade att denna ökade känslighet skulle göra det återkommande testet särskilt användbart för olinjära data som mänskliga reaktionstider.
Han varnade också för att deras metod kan föreslå statistiskt tillförlitliga skillnader som är för små för att vara meningsfulla. "Detta kan vara en baksida av testet för praktiska användare, "Sa Leonardi." Men Vi har inte undersökt sådana effekter på djupet. "
Detta bevis på konceptet visar att RP kan vara användbart för statistiska analysverktyg. Går framåt, teamet planerar att undersöka effekterna av provstorlek på deras metod. Leonardi sa att de också skulle vilja vidareutveckla testet för att modellera andra typer av inferentiell statistik inklusive analys av varians.