Plats för tre ZTF-fält som analyserats i detta arbete med markerade anomalikandidater. Kredit:Maria Pruzhinskaya (2020)
SNAD-teamet, ett internationellt nätverk bildat av forskare från Ryssland, Frankrike och USA, har utvecklat en pipeline för att hitta sällsynta och exotiska föremål bland höstackarna av data från astronomiska undersökningar.
Med tanke på den ständigt ökande storleken på astronomiska datamängder, även om våra teleskop upptäcker oväntade intressanta astronomiska fenomen, det är mycket osannolikt att vi kommer att kunna känna igen dem i mitten av miljoner eller till och med miljarder observationer. Lösningen ligger i automatiska verktyg som är speciellt utformade för att känna igen ovanliga beteenden gömda bland miljarder mätningar. Vissa av dessa verktyg finns redan och används, till exempel, för att identifiera bedrägeri kreditkortsaktiviteter bland miljontals transaktioner varje dag. Dock, deras anpassning till vetenskapliga data är inte okomplicerad på grund av komplikationer som uppstår från karaktären av observationer inom astronomi. SNAD-teamet har arbetat i 3 år med utveckling och anpassningar av sådana lösningar till astronomisammanhang.
Under deras senaste årsmöte, gruppen fokuserade sina ansträngningar på föremål vars ljusstyrka varierar över tiden. Pipelinen kombinerar styrkorna med maskininlärningsalgoritmer och den oersättliga kunskapen från mänskliga experter för att bygga ett robust verktyg för att upptäcka avvikelser. Artikeln beskriver resultaten från tillämpningen av detta ramverk på den tredje dataversionen av Zwicky Transient Facility. Dess trestegsprocess involverade funktionsextraktion på ljuskurvor (som spårar ljusstyrkan hos objekt över tiden), Sök efter anomalikandidater med hjälp av flera maskininlärningsalgoritmer och manuell filtrering av kandidater av en mänsklig expert. Detta sista skede inkluderade också att utföra observationer med andra teleskop när det var möjligt. I den här studien, 4 automatiska inlärningsalgoritmer användes för att flagga 277 anomalikandidater för mänsklig undersökning – av en initial datamängd på 2,25 miljoner objekt.
Gruppen utvecklade också ett speciellt designat webbgränssnitt som möjliggjorde omedelbar visualisering och korsmatchning av varje kandidat med befintliga astronomiska kataloger. Detta konstruerades för att underlätta arbetet för de experter som behöver korrelera anomalikandidaterna med all annan allmänt tillgänglig information om himmelkoordinaterna som undersöks.
Av de 277 föremål som maskinen betraktar som anomala, 188 (68%) visade sig uppvisa ovanliga egenskaper på grund av icke-astrofysiska effekter (inklusive defekter på grund av ZTF:s bildsubtraktionspipeline), 66 (24 %) var objekt som redan tidigare katalogiserats och 23 (8 %) var tidigare okända objekt. Den första kategorin innehåller några roliga kuriosa och de två senare fallen av vetenskapligt intresse. Till exempel, ett objekt flaggat som anomali av maskinen var faktiskt ockultationen av en bakgrundsstjärna av Barcelona-asteroiden, som ur en observatörs synvinkel från jorden upptäcktes som en variabel punktkälla när i verkligheten varken stjärnan eller asteroiden faktiskt ändrade ljusstyrkan. Författarna karakteriserade också återkommande och exotiska bildsubtraktionsartefakter som stör ljuskurvanalys och kan lura en pipeline för avvikelsedetektering att tro att den är en verklig, anomalt föremål. För att hjälpa till att snabbt sortera den första klassen från de återstående kandidaterna, de kunde identifiera en enkel tvådimensionell relation som kan användas för att filtrera potentiellt falska ljuskurvor i framtida studier.
Bland de andra och tredje kategorierna, författarna hittade fyra supernovakandidater, sex tidigare oklassificerade eclipsing binärer, fyra pre-main-sekvenskandidater, en möjlig röd dvärgbloss, och spektroskopiskt bekräftade en RS Canum Venaticorum-stjärna, bland andra anomalikandidater.
Att snabbt och enkelt separera artefakter från intressanta anomalikandidater är avgörande för nuvarande och snart närmande nästa generations observatorier, såsom Vera Rubin Observatory Legacy Survey of Space and Time (LSST). LSST kommer att generera ungefär 10 miljoner transienta källor per natt – sofistikerade och robusta algoritmer kommer att behövas för att sålla igenom all data så att oväntade och intressanta objekt inte missas, och forskare kan bättre förstå dessa rymdkonstigheter.
Huvudförfattare Konstantin Malanchev, forskare vid University of Illinois i Urbana-Champaign (USA) och Sternberg astronomiska institutet i Lomonosov Moskva (Ryssland), säger, "Att designa specifikt dedikerade verktyg för att söka efter astrofysiskt intressanta anomalier är vårt enda alternativ för att säkerställa att datauppsättningar vi kämpat så hårt för att skaffa till fullo utnyttjas. SNAD-teamet är fullt engagerade i att hjälpa det astronomiska samhället att utforska den fulla potentialen av framtida datauppsättningar ."
Artikeln har godkänts för publicering i Månatliga meddelanden från Royal Astronomical Society och är även allmänt tillgänglig som förtryck. Källkoden och resultaten, inklusive en komplett lista över objekt med potentiell vetenskaplig tillämpning, såväl som pipelineteknikerna, är öppna för allmänheten till förmån för och verifiering av det astronomiska samfundet.