Artificiell intelligens och maskininlärning har blivit allestädes närvarande, med tillämpningar som sträcker sig från dataanalys, cybersäkerhet, läkemedelsutveckling, musikkomposition och konstnärliga renderingar.
Under de senaste åren har även stora språkmodeller (LLM) dykt upp, som lagt till mänsklig interaktion och skrivande till den långa listan av applikationer. Detta inkluderar ChatGPT, en LLM som har haft en djupgående inverkan sedan den introducerades för mindre än två år sedan. Denna applikation har väckt stor debatt (och kontrovers) om AI:s potentiella användningsområden och konsekvenser.
Astronomi har också gynnats enormt, där maskininlärning används för att sortera igenom enorma mängder data för att leta efter tecken på planettransit, korrigera för atmosfärisk interferens och hitta mönster i bruset. Enligt ett internationellt team av astrofysiker kan detta bara vara början på vad AI skulle kunna göra för astronomi.
I en nyligen genomförd studie finjusterade teamet en Generative Pre-trained Transformer (GPT) modell med hjälp av observationer av astronomiska objekt. I processen visade de framgångsrikt att GPT-modeller effektivt kan hjälpa till med vetenskaplig forskning.
Studien genomfördes av International Center for Relativistic Astrophysics Network (ICRANet), ett internationellt konsortium bestående av forskare från International Centre for Relativistic Astrophysics (ICRA), National Institute for Astrophysics (INAF), University of Science and Technology i Kina, Chinese Academy of Sciences Institute of High Energy Physics (CAS-IHEP), University of Padova, Isfahan University of Technology och University of Ferrera.
Deras artikel, "Can AI Understand Our Universe? Test of Fine-Tuning GPT by Astrophysical Data," lades nyligen upp på arXiv förtrycksserver.
Som nämnts förlitar sig astronomer i stor utsträckning på maskininlärningsalgoritmer för att sortera genom de datavolymer som erhålls av moderna teleskop och instrument. Denna praktik började för ungefär ett decennium sedan och har sedan dess vuxit med stormsteg till den punkt där AI har integrerats i hela forskningsprocessen. Som ICRA:s ordförande och studiens huvudförfattare Yu Wang sa till Universe Today via e-post:
"Astronomin har alltid drivits av data och astronomer är några av de första forskarna att anamma och använda maskininlärning. Nu har maskininlärning integrerats i hela den astronomiska forskningsprocessen, från tillverkning och kontroll av markbaserade och rymdbaserade teleskop (t.ex. optimera prestandan hos adaptiva optiksystem, förbättra initieringen av specifika åtgärder (triggers) av satelliter under vissa förhållanden, etc.), till dataanalys (t.ex. brusreducering, dataimputation, klassificering, simulering, etc.) , och upprättande och validering av teoretiska modeller (t.ex. testning av modifierad gravitation, begränsning av tillståndsekvationen för neutronstjärnor, etc.)."
Dataanalys är fortfarande det vanligaste bland dessa applikationer eftersom det är det enklaste området där maskininlärning kan integreras. Traditionellt skulle dussintals forskare och hundratals medborgarforskare analysera mängden data som produceras av en observationskampanj.
Detta är dock inte praktiskt i en tid där moderna teleskop samlar in terabyte data dagligen. Detta inkluderar all-sky-undersökningar som Very Large Array Sky Survey (VLASS) och de många faserna som genomförs av Sloan Digital Sky Survey (SDSS).
Hittills har LLM endast tillämpats sporadiskt på astronomisk forskning, med tanke på att de är en relativt ny skapelse. Men enligt förespråkare som Wang har det haft en enorm samhällelig inverkan och har en nedre gränspotential som motsvarar en "industriell revolution."
När det gäller den övre gränsen förutspår Wang att det kan variera avsevärt och kanske kan resultera i mänsklighetens "upplysning eller förstörelse". Men till skillnad från den industriella revolutionen är förändringstakten och integrationen mycket snabbare för AI, vilket väcker frågor om hur långt det kommer att gå.
För att bestämma dess potential för astronomiområdet, sade Wang, antog han och hans kollegor en förtränad GPT-modell och finjusterade den för att identifiera astronomiska fenomen:
"OpenAI tillhandahåller förtränade modeller, och vad vi gjorde är att finjustera, vilket innebär att ändra vissa parametrar baserade på den ursprungliga modellen, så att den kan känna igen astronomiska data och beräkna resultat från dessa data. Detta är ungefär som OpenAI ger oss en student, som vi sedan utbildade till att bli doktorand i astronomi.
"Vi tillhandahöll begränsad data med blygsam upplösning och tränade GPT färre gånger jämfört med vanliga modeller. Trots det är resultaten imponerande och uppnådde en noggrannhet på cirka 90%. Denna höga noggrannhetsnivå kan tillskrivas den robusta grunden för GPT, som förstår redan databehandling och besitter logiska slutledningsförmåga, såväl som kommunikationsförmåga."
För att finjustera sin modell introducerade teamet observationer av olika astronomiska fenomen från olika kataloger. Detta inkluderade 2 000 prover av kvasarer, galaxer, stjärnor och kvasarer med bred absorptionslinje (BAL) från SDSS (500 vardera). De integrerade också observationer av korta och långa gammastrålningsskurar (GRB), galaxer, stjärnor och simuleringar av svarta hål. När den testades klassificerade deras modell framgångsrikt olika fenomen, särskiljde mellan typer av kvasarer, slutade deras avstånd baserat på rödförskjutning och mätte svarta håls spinn och lutning.
"Detta arbete visar åtminstone att LLMs kan bearbeta astronomiska data," sa Wang. "Dessutom är förmågan hos en modell att hantera olika typer av astronomisk data en förmåga som inte finns hos andra specialiserade modeller. Vi hoppas att LLM:er kan integrera olika typer av data och sedan identifiera gemensamma underliggande principer för att hjälpa oss att förstå världen. Naturligtvis , det här är en utmanande uppgift och inte en som astronomer kan utföra ensamma."
Naturligtvis erkänner teamet att datauppsättningen de experimenterade med var mycket liten jämfört med datautdata från moderna observatorier. Detta gäller särskilt för nästa generations anläggningar som Vera C. Rubin Observatory, som nyligen fick sin LSST-kamera, den största digitalkameran i världen!
När Rubin väl är i drift kommer den att genomföra den 10-åriga arvsundersökningen av rum och tid (LSST), som förväntas ge 15 terabyte data per natt! Att tillgodose kraven från framtida kampanjer, säger Wang, kommer att kräva förbättringar och samarbete mellan observatorier och professionella AI-företag.
Ändå är det en självklarhet att det kommer att finnas fler LLM-ansökningar för astronomi inom en snar framtid. Detta är inte bara en trolig utveckling, utan också en nödvändig sådan med tanke på de stora mängder data som astronomiska studier genererar idag. Och eftersom detta sannolikt kommer att öka exponentiellt inom en snar framtid, kommer AI sannolikt att bli oumbärlig för studieområdet.
Mer information: Yu Wang et al, Kan AI förstå vårt universum? Test av finjustering av GPT av Astrophysical Data, arXiv (2024). DOI:10.48550/arxiv.2404.10019
Journalinformation: arXiv
Tillhandahålls av Universe Today