• Home
  • Kemi
  • Astronomien
  • Energi
  • Naturen
  • Biologi
  • Fysik
  • Elektronik
  •  science >> Vetenskap >  >> Fysik
    CMS släpper mer än en petabyte med öppen data

    En kollisionshändelse inspelad av CMS 2012 som visar en "Higgs-kandidat", tillgänglig på CERN Open Data-portalen med den senaste versionen av CMS Open Data. Kredit:Tom McCauley/CMS/CERN

    CMS Collaboration vid CERN har precis offentliggjort ungefär hälften av de data som samlades in 2012 av CMS-detektorn vid Large Hadron Collider. Den här utgåvan innehåller set som används för att upptäcka Higgs-bosonen, och delas via CERN Open Data-portalen.

    Detta är den tredje versionen av högnivå CMS Open Data, efter offentliggörandet av 2010-data under 2014, och 2012 data under 2016. Denna batch innehåller mer än 550 terabyte av proton-proton kollisionsdata registrerade vid en masscentrumenergi på 8 TeV samt cirka 510 terabyte Monte Carlo simuleringsdata.

    LHC-data är komplicerade och stora. CMS-forskare har registrerat petabyte med data från kollisioner vid LHC och har hittills publicerat hundratals vetenskapliga artiklar med dem. Genom att släppa data till det offentliga området, forskare utanför CMS Collaboration har möjlighet att bedriva ny forskning med dem.

    "Våra data är en viktig del av CMS Collaborations rika vetenskapliga arv, " säger CMS talesman, Joel Butler. "Vi vill se till att de inte bara bevaras på lång sikt utan också är tillgängliga för allmänheten, så att både CMS-medlemmar och externa forskare kan ompröva dem i framtiden. Detta är en del av vårt engagemang för öppenhet och långsiktig databevarande."

    Animation som visar ett "Higgs-kandidat"-evenemang, inspelad av CMS 2012 och tillgänglig på CERN Open Data-portalen med den senaste versionen av CMS Open Data. Kredit:Tom McCauley och Achintya Rao CMS/CERN

    Nyligen, de första två sådana forskningsartiklarna publicerades av ett team av teoretiker vid MIT som var intresserade av att utföra en mätning som CMS-forskare själva inte hade gjort:specifikt ville de mäta särskilda understrukturer i kluster av partiklar som kallas "jetstrålar" som produceras i proton-protonkollisioner.

    Den senaste utgåvan av CMS Open Data innehåller också den fascinerande möjligheten att låta människor upprepa analysen som ledde till Higgs upptäckt genom att studera samma data som användes av CMS-forskare för att tillkännage partikelns existens 2012. Som ett bevis på konceptet, CMS-doktoranden Nur Zulaiha Jomhari analyserade CMS Open Data och producerade plotter som liknade några av de som visades när Higgs-upptäckten tillkännagavs. Denna analys är mycket mindre sofistikerad än den officiella CMS-en och granskas inte av det bredare CMS-gruppen av experter, men det visar potentialen hos CMS Open Data.

    Vänster:Den officiella CMS-plotten för kanalen "Higgs till fyra leptoner", visades på dagen för tillkännagivandet av Higgs upptäckt. Höger:En liknande handling producerad av Nur Zulaiha Jomhari et al. använder CMS Open Data från 2011 och 2012. Även om plotterna ser likadana ut, analysen med CMS Open Data använder mer data (vid 8 TeV och totalt) än den officiella CMS från den ursprungliga upptäckten men är mycket mindre sofistikerad och granskas inte av det bredare CMS-gruppen av experter. Kredit:CMS/CERN

    Förutom själva datamängderna, CMS Data Preservation and Open Data-teamet har också sammanställt en omfattande samling av kompletterande material, inklusive exempelkod för att utföra relativt enkla analyser, samt metadata som information om hur data valdes ut och vilka LHC:s körförhållanden var under tiden för datainsamlingen.

    Just nu, CMS har åtagit sig att släppa upp till 50 % av varje års registrerade data några år efter att de samlades in, när CMS-forskare avslutar det mesta av sin analys av dessa datamängder. "Att se vår öppna data användas utanför CMS har varit mycket givande, " säger Kati Lassila-Perini, samordnaren för CMS-databevarande och öppen tillgång. "Det har varit en stor motivation för oss och vi ser fram emot att fortsätta våra banbrytande ansträngningar för att frigöra öppen data av forskningskvalitet från LHC under de kommande åren."

    © Vetenskap https://sv.scienceaq.com