Figur 1:Diagram som illustrerar konstruktionen av blandade prover för att träna en svagt övervakad CWoLa-klassificerare i stötjakten. I ATLAS-sökningen, resonansfunktionen (mres) är dijetmassan och de andra funktionerna (y) är massorna av de två strålarna. Upphovsman:ATLAS Collaboration/CERN
ATLAS Collaboration vid CERN undersöker nya sätt att söka efter nya fenomen. Vid sidan av ett omfattande forskningsprogram som ofta är inspirerat av specifika teoretiska modeller – allt från kvantsvarta hål till supersymmetri – tillämpar fysiker nya modelloberoende metoder för att bredda sina sökningar. ATLAS har just släppt den första modelloberoende sökningen efter nya partiklar med hjälp av en ny teknik som kallas "svag övervakning".
Sökningar efter nya partiklar börjar vanligtvis med en specifik teoretisk modell. Med tanke på modellens fenomenologi och parametrar, fysiker kommer att simulera hur nya partiklar skulle produceras och sönderfalla i ATLAS-detektorn. De simulerar sedan standardmodellens bakgrundsprocesser för att utveckla klassificerare (med eller utan maskininlärning) som separerar signaler från bakgrunden. Dessa klassificerare bestämmer den bästa fas-rymdregionen av data som ska studeras, där en hypotetisk signal förväntas bli berikad. Till sist, fysiker kommer att jämföra data och bakgrundsprognoser på jakt efter avvikelser.
ATLAS nya sökning använder maskinlärande klassificerare (neurala nätverk) utvecklade direkt på data för att minska deras beroende av en specifik modell. Detta är en betydande avvikelse från standardmetoderna eftersom data är omärkta:det är inte känt om en viss proton-protonkollisionshändelse är bakgrund eller signal. Denna metod – känd som "svag övervakning" – utnyttjar strukturer i data utan att behöva etiketter per händelse.
Tillsammans med denna metod, den nya ATLAS-sökningen använder en av de mest traditionella simuleringsoberoende anomalidetekteringsstrategierna:"bumpjakten". Målet med en stötjakt är att leta efter en lokaliserad "bula" ovanpå en jämn bakgrund. Sådana stötar är en generisk egenskap hos många modeller av nya partiklar, där stöten sker vid massan av den nya partikeln. Den nya sökningen bygger på denna starka grund för att öka känsligheten för en mängd olika hypotetiska partiklar utan att specificera deras egenskaper i förväg.
Kombinationen av bumpjakt och svag övervakning resulterar i en analys som mestadels är fri från signalmodell och bakgrundsmodellberoende.
Figur 2:Det neurala nätverkets utdata i en dijet-massbehållare. Som en tvådimensionell funktion, utgången kan lätt visualiseras som en bild, där intensiteten motsvarar effektiviteten hos nätverksutgången i dijet-massbehållaren. Det vänstra diagrammet har ingen signal injicerad och det högra diagrammet visar utsignalen när en hypotetisk partikel vid 3 TeV som sönderfaller till två andra partiklar vid 200 GeV läggs till data. Upphovsman:ATLAS Collaboration/CERN
Upptäcka anomalier med svag övervakning
ATLAS-fysiker tränade neurala nätverk på data med en teknik som kallas "Klassificering utan etiketter" (CWoLa, uttalas "Koala"). I detta tillvägagångssätt, fysiker konstruerar två blandade datamängder som består av bakgrund och potentiellt även signal. Dessa är identiska förutom de relativa proportionerna av potentialsignalen. Medan signal-vs-bakgrundsetiketterna är okända för varje händelse, de neurala nätverken kan tränas för att skilja mellan de två datamängderna. Med tillräckligt med data och en tillräckligt kraftfull klassificerare, detta är faktiskt optimalt för att skilja signal från bakgrund.
CWoLa-metoden kombineras med en bump-jakt när man skapar de blandade datamängderna ovan, såsom visas i figur 1. Signalhändelser skulle karakteriseras av en lokaliserad resonansregion och en sidbandsregion. Dessa regioner skulle ha andra funktioner (y) som också kan användas för att träna de neurala nätverken. Om det inte finns någon signal, ett neuralt nätverk skulle inte lära sig någonting och om det finns en signal, det kan lära sig att plocka ut det över bakgrunden.
Den nya ATLAS-sökningen är den första tillämpningen av helt datadriven maskininlärningsförbättrad anomalidetektering. Sökningen undersökte händelser med hadroniska sluttillstånd, använda den oföränderliga massan av par av partikel-"strålar" som resonansdrag och massorna av de individuella strålarna som egenskaper för att träna CWoLa-klassificeraren. Genom att använda denna begränsade uppsättning funktioner, fysiker har framgångsrikt etablerat proceduren och har funnit att den redan är känslig för ett brett spektrum av nya partiklar.
Fysiker kunde träna de neurala nätverken samtidigt som de undvek en statistisk testfaktor som skulle minska känsligheten för sökningen från träning och testning på samma data. Det neurala nätverket (Figur 2) kartläggs till en effektivitet. Till exempel, 10% betyder att 90% av händelserna har en nätverksutgång som är lägre än detta värde. I avsaknad av signalen, nätverket ska inte lära sig något (eftersom de två blandade datamängderna ska vara samma), men det måste finnas en region med låg effektivitet genom design. Det högra diagrammet i figur 2 visar att nätverket kan identifiera den injicerade signalen, trots att det inte var sagt var man skulle leta i förväg!
Figur 3:Speciella signaler simuleras och läggs sedan till data för att sätta gränser. De modeller som valts här representerar en tung partikel A (med en massa på 3 TeV) som sönderfaller till två andra nya partiklar B och C med massor skrivna på den horisontella axeln. Den vertikala axeln är gränsen - lägre siffror indikerar starkare gränser. Den nya sökningen jämförs med två befintliga resultat från ATLAS:den inkluderande dijet -sökningen (röda trianglar) och en särskild sökning efter jetplan som producerats från W- och Z -bosoner (grått kors). Upphovsman:ATLAS Collaboration/CERN
Ger ny precision
Den nya sökningen resulterade inte i betydande bevis för nya partiklar och att kvantifiera det som inte hittades var dess egen utmaning. Vanligtvis, fysiker kan helt enkelt fråga hur mycket signal som skulle behöva läggas till för att registrera ett betydande överskott, och sedan förklaras den signalmängden vara exkluderad eftersom inget överskott observerades. För att uppnå liknande undantag för denna analys krävdes att alla neurala nätverk tränades om för varje modellerad signaltyp och signalmängd.
De resulterande gränserna presenteras i figur 3. Att producera denna plot krävde träning omkring 20, 000 neurala nätverk! Vissa signaler var svårare för neurala nätverk att hitta än andra, med de i regioner med mycket bakgrund visar sig vara särskilt utmanande. För andra signaler, de nya gränserna är starkare än tidigare gränser och förbättras jämfört med tidigare sökningar i ett liknande fasutrymme.
Tittar på framtiden
Detta nya tillvägagångssätt från ATLAS har många möjligheter till förlängningar. Den svagt övervakade bump-jakten kan tillämpas på ytterligare händelsetopologier och fler funktioner kan läggas till för att bredda känsligheten för nya partiklar. Mer komplexa neurala nätverk kan behövas för att rymma utrymmen med högre dimensioner och detta kommer att kräva krävande beräkningsresurser. ATLAS-fysiker överväger också en mängd olika alternativa anomali-detektionstekniker, som kanske kan komplettera den CWoLa-baserade sökningen. Det är troligt att ingen metod kommer att täcka allt – det kommer att behövas flera tillvägagångssätt för att säkerställa breda, robust, och stark känslighet för nya partiklar.