Forskare levererade en 15-petaflop mjukvara för djupinlärning och körde den på Cori, en superdator vid National Energy Research Scientific Computing Center, en Department of Energy Office of Science användaranläggning. Kredit:Lawrence Berkeley National Laboratory
Maskininlärning, en form av artificiell intelligens, åtnjuter oöverträffad framgång i kommersiella tillämpningar. Dock, användningen av maskininlärning i högpresterande beräkningar för vetenskap har varit begränsad. Varför? Avancerade verktyg för maskininlärning var inte designade för stora datamängder, som de som används för att studera stjärnor och planeter. Ett team från Intel, National Energy Research Scientific Computing Center (NERSC), och Stanford ändrade den situationen. De utvecklade den första 15-petaflop djupinlärningsmjukvaran. De visade sin förmåga att hantera stora datamängder via testkörningar på Coris superdator.
Använda maskininlärningstekniker på superdatorer, forskare kunde hämta insikter från stora, komplexa datamängder. Kraftfulla instrument, som acceleratorer, producera massiva datamängder. Den nya mjukvaran skulle kunna göra världens största superdatorer kapabla att passa in sådan data i djupinlärning. De resulterande insikterna kan gynna modellering av jordsystem, fusionsenergi, och astrofysik.
Maskininlärningstekniker har potential för att göra det möjligt för forskare att utvinna värdefulla insikter från stora, komplexa datamängder som produceras av acceleratorer, Ljuskällor, teleskop, och datorsimuleringar. Även om dessa tekniker har haft stor framgång i en mängd olika kommersiella tillämpningar, deras användning i högpresterande beräkningar för vetenskap har begränsats eftersom befintliga verktyg inte var designade för att fungera med de terabyte- till petabyte-stora datamängderna som finns i många vetenskapsdomäner.
För att lösa detta problem ett samarbete mellan Intel, National Energy Research Scientific Computing Center, och Stanford University har arbetat med att lösa problem som uppstår när man använder tekniker för djupinlärning, en form av maskininlärning, på terabyte och petabyte datamängder. Teamet utvecklade den första 15-petaflop djupinlärningsmjukvaran. De demonstrerade dess skalbarhet för dataintensiva applikationer genom att utföra ett antal träningskörningar med hjälp av stora vetenskapliga datamängder. Körningarna använde fysik- och klimatbaserade datamängder på Cori, en superdator belägen vid National Energy Research Scientific Computing Center. De uppnådde en topphastighet mellan 11,73 och 15,07 petaflops (enkel precision) och en genomsnittlig uthållig prestanda på 11,41 till 13,47 petaflops. (En petaflop är miljoner miljarder beräkningar per sekund.)