Världar som kretsar om andra stjärnor än vår sol är "exoplaneter, ” och de finns i många storlekar, från gasjättar större än Jupiter till små, steniga planeter. Denna illustration av en "superjord" representerar den typ av planet som TESS-uppdraget syftar till att hitta utanför vårt solsystem. Kredit:M. Kornmesser/ESO
När MIT lanserade MIT Stephen A. Schwarzman College of Computing i höstas, ett av målen var att driva ytterligare innovation inom datoranvändning på alla MIT:s skolor. Forskare expanderar redan bortom traditionella tillämpningar av datavetenskap och använder dessa tekniker för att främja en rad vetenskapliga områden, från cancermedicin till antropologi till design – och till upptäckten av nya planeter.
Beräkning har redan visat sig användbar för Transiting Exoplanet Survey Satellite (TESS), ett NASA-finansierat uppdrag som leds av MIT. Lanserades från Cape Canaveral i april 2018, TESS är en satellit som tar bilder av himlen när den kretsar runt jorden. Dessa bilder kan hjälpa forskare att hitta planeter som kretsar runt stjärnor bortom vår sol, kallas exoplaneter. Detta jobb, som nu är halvvägs färdig, kommer att avslöja mer om de andra planeterna inom vad NASA kallar vårt "solkvarter".
"TESS har precis avslutat det första av sitt tvååriga främsta uppdrag, undersöker den södra natthimlen, säger Sara Seager, en astrofysiker och planetforskare vid MIT och biträdande vetenskapschef för TESS. "TESS hittade över 1, 000 planetkandidater och cirka 20 bekräftade planeter, vissa i flera planetsystem."
Även om TESS har möjliggjort några imponerande upptäckter hittills, Att hitta dessa exoplaneter är ingen enkel uppgift. TESS samlar in bilder på mer än 200, 000 avlägsna stjärnor, sparar en bild av dessa planeter varannan minut, samt att spara en bild av en stor himmelsträcka var 30:e minut. Seager säger varannan vecka, vilket är hur lång tid det tar för satelliten att kretsa runt jorden, TESS skickar cirka 350 gigabyte data (när den är okomprimerad) till jorden. Medan Seager säger att detta inte är så mycket data som folk kan förvänta sig (en 2019 Macbook Pro har upp till 512 gigabyte lagringsutrymme), Att analysera data innebär att man tar många komplexa faktorer i beaktande.
Seager, som säger att hon länge har varit intresserad av hur beräkning kan användas som ett verktyg för vetenskap, började diskutera projektet med Victor Pankratius, en före detta huvudforskare vid MIT:s Kavli Institute for Astrophysics and Space Research, som nu är direktör och chef för global mjukvaruteknik på Bosch Sensortec. En utbildad datavetare, Pankratius säger att efter att ha kommit till MIT 2013, han började tänka på vetenskapliga områden som producerar stor data, men som ännu inte har dragit full nytta av datortekniker. Efter att ha pratat med astronomer som Seager, han lärde sig mer om data som deras instrument samlar in och blev intresserad av att använda datorstödda upptäcktstekniker för att söka efter exoplaneter.
"Universum är en stor plats, " säger Pankratius. "Så jag tycker att det är en stor sak att utnyttja det vi har på datavetenskapssidan."
Den grundläggande idén bakom TESS uppdrag är att liksom vårt eget solsystem, där jorden och andra planeter kretsar runt en central stjärna (solen), det finns andra planeter bortom vårt solsystem som kretsar runt olika stjärnor. Bilderna som TESS samlar in producerar ljuskurvor – data som visar hur stjärnans ljusstyrka förändras över tiden. Forskare analyserar dessa ljuskurvor för att hitta fall i ljusstyrka, vilket kan tyda på att en planet passerar framför stjärnan och tillfälligt blockerar en del av dess ljus.
"Varje gång en planet kretsar, du skulle se denna ljusstyrka sjunka, " säger Pankratius. "Det är nästan som ett hjärtslag."
Problemet är att inte varje nedgång i ljusstyrka nödvändigtvis orsakas av en förbipasserande planet. Seager säger att maskininlärning för närvarande spelar in under "triage"-fasen av deras TESS-dataanalys, hjälpa dem att skilja mellan potentiella planeter och andra saker som kan orsaka sänkningar i ljusstyrkan, som variabla stjärnor, som naturligt varierar i sin ljusstyrka, eller instrumentljud.
Analyser på planeter som passerar genom triage görs fortfarande av forskare som har lärt sig att "läsa" ljuskurvor. Men teamet använder nu tusentals ljuskurvor som har klassificerats av ögat för att lära neurala nätverk hur man identifierar exoplanetpassager. Beräkningar hjälper dem att begränsa vilka ljuskurvor de bör undersöka mer i detalj. Liang Yu Ph.D. '19, en nyutexaminerad fysik, bygger på en befintlig kod för att skriva maskininlärningsverktyget som teamet nu använder.
Även om det är användbart för att hitta de mest relevanta uppgifterna, Seager säger att maskininlärning ännu inte kan användas för att helt enkelt hitta exoplaneter. "Vi har fortfarande mycket att göra, " hon säger.
Pankratius håller med. "Vad vi vill göra är att skapa datorstödda upptäcktssystem som gör detta för alla [stjärnor] hela tiden, " säger han. "Du vill bara trycka på en knapp och säga, visa mig allt. Men just nu är det fortfarande människor med viss automatisering som kontrollerar alla dessa ljuskurvor."
Seager och Pankratius undervisade också i en kurs som fokuserade på olika aspekter av beräknings- och artificiell intelligens (AI)-utveckling inom planetvetenskap. Seager säger att inspirationen till kursen uppstod från ett växande intresse från studenter att lära sig om AI och dess tillämpningar för banbrytande datavetenskap.
Under 2018, kursen gjorde det möjligt för eleverna att använda faktiska data som samlats in av TESS för att utforska maskininlärningsapplikationer för dessa data. Modellerad efter en annan kurs som Seager och Pankratius lärde ut, studenter i kursen kunde välja ett vetenskapligt problem och lära sig beräkningsfärdigheterna för att lösa det problemet. I detta fall, eleverna lärde sig om AI-tekniker och tillämpningar för TESS. Seager säger att eleverna fick stor respons på den unika klassen.
"Som student, du kan faktiskt göra en upptäckt, " säger Pankratius. "Du kan bygga en maskininlärningsalgoritm, kör den på denna data, och vem vet, kanske hittar du något nytt."
Mycket av den data som TESS samlar in är också lättillgänglig som en del av ett större medborgarvetenskapligt projekt. Pankratius säger att alla med rätt verktyg kan börja göra egna upptäckter. Tack vare molnanslutningen, detta är till och med möjligt på en mobiltelefon.
"Om du blir uttråkad på din bussresa hem, varför inte leta efter planeter?" säger han.
Pankratius säger att den här typen av samarbete gör det möjligt för experter inom varje domän att dela sin kunskap och lära av varandra, snarare än att var och en försöker fastna i den andras fält.
"Över tid, vetenskapen har blivit mer specialiserad, så vi behöver sätt att integrera specialisterna bättre, " säger Pankratius. Datorhögskolan kan hjälpa till att skapa fler sådana samarbeten, han lägger till. Pankratius säger också att det kan locka forskare som arbetar i skärningspunkten mellan dessa discipliner, som kan överbrygga klyftor i förståelse mellan experter.
Denna typ av arbete som integrerar datavetenskap blir redan allt vanligare inom vetenskapsområden, Seager anteckningar. "Maskininlärning är "på modet" just nu, " hon säger.
Pankratius säger att det delvis beror på att det finns fler bevis för att utnyttjande av datavetenskapliga tekniker är ett effektivt sätt att ta itu med olika typer av problem och växande datamängder.
"Vi har nu demonstrationer inom olika områden att den datorstödda upptäcktsmetoden inte bara fungerar, " säger Pankratius. "Det leder faktiskt till nya upptäckter."