Öppna den svarta lådan med automatiserad maskininlärning

Forskare från MIT och andra håll har utvecklat ett interaktivt verktyg som, för första gången, låter användare se och kontrollera hur allt mer populära system för automatisk maskininlärning (AutoML) fungerar. Kredit:Chelsea Turner, MIT

Forskare från MIT och andra håll har utvecklat ett interaktivt verktyg som, för första gången, låter användare se och kontrollera hur automatiserade maskininlärningssystem fungerar. Syftet är att bygga upp förtroende för dessa system och hitta sätt att förbättra dem.

Att designa en maskininlärningsmodell för en viss uppgift – som bildklassificering, sjukdomsdiagnoser, och aktiemarknadsförutsägelser - är en svår, tidskrävande process. Experter väljer först bland många olika algoritmer att bygga modellen kring. Sedan, de justerar manuellt "hyperparametrar" - som bestämmer modellens övergripande struktur - innan modellen börjar träna.

Nyligen utvecklade automatiserade maskininlärningssystem (AutoML) testar och modifierar iterativt algoritmer och dessa hyperparametrar, och välj de bäst lämpade modellerna. Men systemen fungerar som "svarta lådor, betyder att deras urvalstekniker är dolda för användarna. Därför användare kanske inte litar på resultaten och kan ha svårt att skräddarsy systemen efter deras sökbehov.

I en artikel som presenterades vid ACM CHI-konferensen om mänskliga faktorer i datorsystem, forskare från MIT, Hong Kong University of Science and Technology (HKUST), och Zhejiang University beskriver ett verktyg som lägger analyser och kontroll av AutoML-metoder i användarnas händer. Kallas ATMSeer, verktyget tar som indata ett AutoML-system, en datauppsättning, och lite information om en användares uppgift. Sedan, den visualiserar sökprocessen i ett användarvänligt gränssnitt, som presenterar djupgående information om modellernas prestanda.

"Vi låter användare välja och se hur AutoML-systemen fungerar, " säger medförfattaren Kalyan Veeramachaneni, en huvudforskare vid MIT Laboratory for Information and Decision Systems (LIDS), som leder Data to AI-gruppen. "Du kanske helt enkelt väljer den bästa modellen, eller så kanske du har andra överväganden eller använder domänexpertis för att vägleda systemet att söka efter vissa modeller framför andra."

I fallstudier med vetenskapsstudenter, vilka var AutoML-noviser, forskarna fann att cirka 85 procent av deltagarna som använde ATMSeer var säkra på de modeller som valts ut av systemet. Nästan alla deltagare sa att användningen av verktyget gjorde dem bekväma nog att använda AutoML-system i framtiden.

"Vi fann att människor var mer benägna att använda AutoML som ett resultat av att öppna den svarta lådan och se och kontrollera hur systemet fungerar, " säger Micah Smith, en doktorand vid institutionen för elektroteknik och datavetenskap (EECS) och en forskare i LIDS.

Verktyget, ATMSeer, genererar ett användarvänligt gränssnitt som visar djupgående information om en vald modells prestanda, samt urvalet av algoritmer och parametrar som alla kan justeras. Kredit:Massachusetts Institute of Technology

"Datavisualisering är ett effektivt tillvägagångssätt för bättre samarbete mellan människor och maskiner. ATMSeer exemplifierar denna idé, " säger huvudförfattaren Qianwen Wang från HKUST. "ATMSeer kommer främst att gynna maskinlärande utövare, oavsett deras domän, [som] har en viss kompetensnivå. Det kan lindra smärtan med att manuellt välja maskininlärningsalgoritmer och ställa in hyperparametrar."

Går med Smith, Veeramachaneni, och Wang på tidningen är:Yao Ming, Qiaomu Shen, Dongyu Liu, och Huamin Qu, hela HKUST; och Zhihua Jin från Zhejiang University.

Trimma modellen

Kärnan i det nya verktyget är ett anpassat AutoML-system, kallas "Auto-Tuned Models" (ATM), utvecklad av Veeramachaneni och andra forskare 2017. Till skillnad från traditionella AutoML-system, ATM katalogiserar alla sökresultat helt när den försöker anpassa modeller till data.

ATM tar vilken datauppsättning som helst och en kodad prediktionsuppgift som indata. Systemet väljer slumpmässigt en algoritmklass – som neurala nätverk, beslutsträd, random skog, och logistisk regression – och modellens hyperparametrar, till exempel storleken på ett beslutsträd eller antalet neurala nätverkslager.

Sedan, systemet kör modellen mot datamängden, iterativt justerar hyperparametrarna, och mäter prestanda. Den använder vad den har lärt sig om den modellens prestanda för att välja en annan modell, och så vidare. I slutet, systemet matar ut flera topppresterande modeller för en uppgift.

Tricket är att varje modell i huvudsak kan behandlas som en datapunkt med några variabler:algoritm, hyperparametrar, och prestanda. Att bygga vidare på det arbetet, forskarna designade ett system som plottar datapunkterna och variablerna på utsedda grafer och diagram. Därifrån, de utvecklade en separat teknik som också låter dem konfigurera om dessa data i realtid. "Knepet är att med dessa verktyg, allt du kan visualisera, du kan också ändra, " säger Smith.

Liknande visualiseringsverktyg är skräddarsydda för att analysera endast en specifik maskininlärningsmodell, och tillåter begränsad anpassning av sökutrymmet. "Därför, de erbjuder begränsat stöd för AutoML-processen, där konfigurationerna av många sökta modeller måste analyseras, " säger Wang. "Däremot, ATMSeer stöder analys av maskininlärningsmodeller genererade med olika algoritmer."

Användarkontroll och förtroende

ATMSeers gränssnitt består av tre delar. En kontrollpanel låter användare ladda upp datauppsättningar och ett AutoML-system, och starta eller pausa sökprocessen. Nedanför finns en översiktspanel som visar grundläggande statistik – som antalet sökta algoritmer och hyperparametrar – och en "leaderboard" med topppresterande modeller i fallande ordning. "Det här kan vara den vy du är mest intresserad av om du inte är en expert som dyker in i de fina detaljerna, " säger Veeramachaneni.

ATMSeer inkluderar en "AutoML Profiler, " med paneler som innehåller djupgående information om algoritmerna och hyperparametrarna, som alla kan justeras. En panel representerar alla algoritmklasser som histogram – ett stapeldiagram som visar fördelningen av algoritmens prestandapoäng, på en skala från 0 till 10, beroende på deras hyperparametrar. En separat panel visar spridningsdiagram som visualiserar avvägningarna i prestanda för olika hyperparametrar och algoritmklasser.

Fallstudier med experter på maskininlärning, som inte hade någon AutoML-erfarenhet, avslöjat att användarkontroll hjälper till att förbättra prestandan och effektiviteten i AutoML-valet. Användarstudier med 13 doktorander inom olika vetenskapliga områden – som biologi och finans – var också avslöjande. Resultaten indikerar tre huvudfaktorer – antalet sökte algoritmer, systemkörning, och hitta den bästa modellen – bestämt hur användare anpassade sina AutoML-sökningar. Den informationen kan användas för att skräddarsy systemen för användare, säger forskarna.

"Vi har precis börjat se början på de olika sätten som människor använder dessa system och gör val, " säger Veeramachaneni. "Det beror på att nu när all denna information finns på ett ställe, och folk kan se vad som händer bakom kulisserna och har makten att kontrollera det."

Den här historien återpubliceras med tillstånd av MIT News (web.mit.edu/newsoffice/), en populär webbplats som täcker nyheter om MIT-forskning, innovation och undervisning.

Använder ett simuleringsramverk för att studera ryggradsbeteenden hos fyrbäddsrobotar

Energilagringsprojekt i Utah beskrivs som världens största i sitt slag

Elektronik