Från data (poäng) som ges till den vetenskapliga roboten, den kan hitta den lag som bäst beskriver dem (blå yta) och deras exakta matematiska uttryck. Kredit:URV
Det är nu möjligt att förutsäga vem som är den bästa kandidaten för att ta emot en organtransplantation, veta om en banks kunder kommer att återbetala de lån de begär, välja de filmer som bäst överensstämmer med konsumenternas intressen, eller till och med välja någons idealiska partner. Matematiska algoritmer analyserar ständigt miljontals dataobjekt, identifiera mönster och göra förutsägelser om alla livsområden. Men i de flesta fall, resultaten ger lite mer än en sluten förutsägelse som inte kan tolkas och som ofta påverkas av fördomar i originaldata.
Nu, ett team från forskargruppen SEES:lab vid Institutionen för kemiteknik vid Universitat Rovira I Virgili och ICREA har gjort ett genombrott med utvecklingen av en ny algoritm som gör mer exakta förutsägelser och genererar matematiska modeller som också gör det möjligt att förstå dessa förutsägelser. Resultaten av denna forskning har precis publicerats i tidskriften Vetenskapliga framsteg .
"Syftet med vår studie var att skapa det som kallas en vetenskaplig robot, en algoritm som kan tillämpa den kunskap och expertis som en forskare har för att tolka data, " förklarar Marta Sales-Pardo, en av författarna till tidningen. Resultaten som algoritmen ger kännetecknas av att de är tolkbara. "Det är som om någon hade utarbetat en lag eller en teori om systemet som studeras. Algoritmen ger dig de matematiska relationerna mellan variablerna den har analyserat och den gör det helt oberoende, "tillägger Roger Guimerà, en ICREA-forskare från samma grupp.
När ett företag har en enorm mängd data som det vill utnyttja, det kan göra det genom att anställa någon för att prova olika modeller, föreslå formler och hitta vilken som fungerar bäst genom att utföra experiment för att validera dem. Detta kommer att leda till en matematisk formel som gör det möjligt att modellera systemet men det innebär en betydande investering i tid och pengar.
En annan möjlighet är att hitta en specialist på maskininlärning, en vetenskaplig disciplin inom området artificiell intelligens som skapar system som identifierar komplexa mönster i enorma datamängder, lära dig automatiskt och skapa en "black-box" -modell som kan göra förutsägelser. Dock, dessa system ger ingen annan information och om förutsägelsen misslyckas är det omöjligt att veta var felet ligger och vad som behöver göras för att förhindra det.
Algoritmen som utvecklats vid URV tar det bästa av de två fallen:den bearbetar data automatiskt, snabbt och pålitligt, som maskininlärningssystemet gör, och det ger också ett resultat som är en tolkningsbar modell.
Algoritmen kan användas för att analysera och tolka data från vilken disciplin som helst i en process som är mycket mer smidig och effektiv än de som finns hittills. Men det verkliga mervärdet är den information som systemet ger. "Inom medicin, till exempel, om du måste fatta ett beslut baserat på data är det mycket viktigt att förstå varför varje beslut har fattats och risken att göra ett misstag, " förklarar Guimerà. "Även om algoritmen också har visat att den är mycket exakt, det viktigaste är att du kan förstå resultaten eftersom du har byggt en maskinvetare som, utan förkunskaper, kan ta en uppsättning data och utveckla en teori som löser problemet, " tillägger Ignasi Reichardt, en annan forskare i teamet.
I den här studien, algoritmen har tillämpats på ett grundläggande problem med vätskefysik i samarbete med forskargruppen Experimentation, Beräkning och modellering i vätskemekanik och turbulens vid URV:s avdelning för maskinteknik.