• Home
  • Kemi
  • Astronomien
  • Energi
  • Naturen
  • Biologi
  • Fysik
  • Elektronik
  • Forskning om maskininlärning kan hjälpa många branscher

    Kredit:CC0 Public Domain

    Spam e-post, bankbedrägerier, diabetes, arbetare som slutar sina jobb. Vad har dessa ämnen gemensamt? Svaret kan hittas i forskning om maskininlärning vid Binghamton University.

    Dana Bani-Hani, en doktorand som studerar industri- och systemteknik, har ägnat de senaste åren åt att lära maskiner hur man läser datamängder i vilken bransch som helst. Systemet hon kodade, kallat ett rekursivt neuralt nätverks-orakel för allmän regression (R-GRNN Oracle), tar datainmatningar och skapar prediktionsutdata.

    Regressionsmodeller är inte nya inom datavetenskap och analys, men vad Bani-Hani skapade går utöver grunderna. Ett typiskt system använder algoritmer, kallas klassificerare, som går igenom en datamängd med många olika variabler för att skapa en förutsägelse. Orakel skapas för att köra flera uppsättningar av dessa klassificerare för att se vilken algoritm som skapar den mest exakta förutsägelsen.

    Till exempel, en klassificerare kan titta på otaliga e-postmeddelanden och ta hänsyn till viss ordanvändning, ordantal och flera andra variabler för att avgöra om e-postmeddelandet är skräppost. Ett orakel tittar på de olika klassificeringsutmatningarna och avgör vilken som mest exakt förutspådde spam-e-postmeddelandena.

    Det som skiljer R-GRNN Oracle från andra orakel är dess förmåga att ta klassificerare utdata och rangordna dem baserat på deras noggrannhet. Baserat på rankingen, klassificerare ges vikter och kombineras för att producera en förutsägelse som är överlägsen varje klassificerare för sig.

    Tänk på den här processen som en orkester. Varje instrument har sina egna styrkor, precis som olika klassificerare, så det är bra att ta med dem alla. Dirigenten, som R-GRNN Oracle, styr de olika instrumenten att spela högt eller mjukare baserat på hur instrumentet låter den slutliga symfonin.

    Vid denna tidpunkt, systemet skulle kallas ett General Regression Neural Network (GRNN), som har skapats tidigare vid Binghamton University. Den verkliga kärnan i Bani-Hanis arbete ligger i den första bokstaven, R, står för Rekursion.

    R-GRNN Oracle tar den ursprungliga GRNN-utgången, och använder hela systemet som indata för en annan GRNN-förutsägelse. Detta kombineras med den mest framgångsrika av de ursprungliga klassificerarna.

    Så, tillbaka till orkestern:Originalsymfonin är inspelad, och spelas sedan upp igen senare. Den här gången, tillsammans med inspelningen, några instrument spelar igen för att ytterligare finjustera orkesterns viktiga ljud.

    "På grund av hur [GRNN] fungerar, Jag kunde skapa den rekursiva modellen, " säger Bani-Hani. "Begreppet rekursion används inte i stor utsträckning inom maskininlärning, så jag bestämde mig för att sätta ett orakel inuti ett orakel."

    Mohammad Khasawneh, professor och institutionsordförande i systemvetenskap och industriteknik, handleda Bani-Hanis forskning. Han säger att system som GRNN och R-GRNN är underutnyttjade och är avgörande i allvarliga livshändelser.

    "Det traditionella GRNN-oraklet har fått begränsad uppmärksamhet i litteraturen eftersom endast mycket få forskare har publicerat arbete om algoritmen, " säger Khasawneh. "Men många verkliga problem som tillämpar maskininlärningsmodeller för att automatisera klassificering av okända observationer kräver exakta förutsägelser. Uppgifter som att diagnostisera sjukdomar kräver precision för att undvika allvarliga problem som potentiellt kan leda till problem som stämningar eller till och med dödsfall."

    Bani-Hani säger att R-GRNN Oracle producerar mer exakta förutsägelser än någon enskild klassificerare ensam, samt ett GRNN för sig. R-GRNN Oracle tog in tusentals e-postprover, programmerad till faktor 57 variabler, och producerade sedan en spamförutsägelse som är överlägsen alla andra testade klassificerare.

    Bani-Hani använde också R-GRNN för att förutse bedrägeri med kreditkortsansökningar, diabetesdiagnos och om en arbetare kommer att sluta baserat på tidigare erfarenheter från arbetsplatsen. I varje fall, R-GRNN kom ut som den mest exakta prediktorn.

    Hon planerar att fokusera sin modell på specifika områden, såsom företag eller finans, samt paketera både GRNN Oracle och R-GRNN Oracle så att företag inte behöver skapa hela koden från grunden.

    Bani-Hanis resa till forskning om maskininlärning startade nästan 6, 000 miles från Binghamton i Jordanien. Efter att ha avslutat sin kandidatexamen i arkitekturteknik, hon hörde om Binghamton University genom Watson Schools fakulteter och akademiska ledare, och från hennes fars stödjande förslag. Hon tog först en magisterexamen i industriteknik, men hon hittade snart en ny passion:datautvinning och maskininlärning.

    "Att ta en doktorsexamen har varit en dröm för mig de senaste 15 åren, " säger Bani-Hani. "Jag tillskriver detta främst till att ha en familj med avancerade examina. Jag är tacksam mot mina professorer här vid Binghamton University för att de introducerade mig för de ämnen som utgör min forskning."


    © Vetenskap https://sv.scienceaq.com