• Home
  • Kemi
  • Astronomien
  • Energi
  • Naturen
  • Biologi
  • Fysik
  • Elektronik
  • Tapis datorplattform väver samman vetenskapliga datorverktyg

    Utvecklingen har startat på Tapis mjukvaruplattform, som syftar till att hjälpa forskare att lättare utnyttja kraftfulla superdatorer och integrera och hantera data från olika och avlägsna källor. Kredit:TACC/UH

    Forskare som vill minska sin komplexitet till forskning och lägga till ett nytt beräkningsverktyg till sitt verktygsbälte kan utforska Tapis-projektet. Tapis mjukvaruplattform syftar till att hjälpa forskare att lättare utnyttja kraftfulla superdatorer och integrera och hantera data från olika och avlägsna källor.

    National Science Foundation (NSF) tilldelade ett anslag på 2,9 miljoner dollar till Texas Advanced Computing Center (TACC) och University of Texas i Austin (UT Austin), utöver ett pris på 1 miljon dollar till University of Hawaii (UH). NSF-utmärkelserna startade september 2019 och stöder fortsatt utveckling av Tapis, förkortning för TACC-API:er och spelar bort ordet gobeläng – vävning av tjänster och möjligheter. Ett applikationsprogrammeringsgränssnitt (API) är ett gränssnitt till ett mjukvarusystem som har byggts eller konstruerats för att ett annat program ska kunna användas.

    "Tapis är en forskningsdatorplattform för beräkningsvetenskap och beräkningsforskning, " sa chefsutredaren (PI) Joe Stubbs, som leder Cloud and Interactive Computing Group på TACC. "Tapis är ett mjukvarusystem som hjälper forskare att använda superdatorerna och andra typer av datorresurser som vi har här på TACC och på andra platser."

    "Det enklaste sättet att beskriva Tapis är att det är en webbaserad applikation som ger alla verktyg en modern vetenskapsman behöver för att göra dataintensiva, beräkningsintensiv forskning, " sa Co-PI Gwen A. Jacobs, chef för cyberinfrastruktur, University of Hawaii System. "En av sakerna som är annorlunda med Tapis är att den väver samman alla viktiga verktyg som forskaren behöver. Det är Tapis verkliga kraft."

    Tapis kommer att betjäna en mångsidig grupp användare med varierande expertis i att använda beräkningsverktyg för sin forskning. I ena änden av spektrumet kommer "power users" att finnas med lång erfarenhet av avancerade datorresurser och programmering. Tapis kommer att hjälpa dem att automatisera och effektivisera sina stora arbetsflöden eller pipelines av mjukvaruapplikationer.

    I den motsatta änden av spektrumet har forskare precis börjat utnyttja möjligheterna att tillämpa avancerad datoranvändning i sin forskning. "Vad vi försöker göra för dem med Tapis, sa Stubbs, "det är den enklaste vägen till att köra beräkningsprogram på superdatorerna."

    Och så är det gruppen i mitten, typiskt stora programvaruutvecklingsprojekt fokuserade på specifika forskningsdomäner, såsom immunologi, astronomi, eller bioinformatik.

    "Målet med Tapis är att göra det möjligt för forskare att få tillgång till dessa beräkningsresurser på ett mer användarvänligt sätt, sa Stubbs.

    De NSF-finansierade beräkningsresurserna beskrivs i stora drag som cyberinfrastruktur, online-ekosystemet som delas av forskare, uppbackad av avancerade datorresurser, värd i datacenter, och med stöd av experter. "Webbutvecklarteam och andra utvecklare på dessa cyberinfrastrukturprojekt kan utnyttja Tapis för att bygga sitt cyberinfrastrukturprojekt snabbare."

    För dessa ändamål, ett exempel är TAPIS API-ramverksstöd för streaming av sensordata, var i ett komplext arbetsflöde, en händelse, såsom en detektering på en sensoruppsättning, kan utlösa en annan händelse, och så vidare, eller till och med flera analysrutiner.

    "Händelsedriven datoranvändning, " förklarade Jacobs, "betyder att arbetsflödet inte är igång hela tiden. Det är en fantastisk funktion för forskare som måste få sina data sporadiskt, där de hämtar data från källor som sensorer och datauppladdningar. Det betyder att de inte behöver köra all kod manuellt. När arbetsflödet är konfigurerat, det kan vara handsfree-datorer, på ett sätt, handsfree analys."

    Tapis kommer att integrera Cloud-Hosted Real-time Data Services for the Geosciences (CHORDS)-projektet, del av den NSF-finansierade EarthCube, för att uppnå händelsestyrd datoranvändning.

    API:erna som tillämpas på vetenskap tillåter olika system att prata med varandra, på sätt och vis. "Idén med Tapis, sa Stubbs, "är att ha ett maskinläsbart och förbrukningsbart gränssnitt till beräkningsresurser, som superdatorer, men också högpresterande lagringssystem, som vårt Corral-lagringssystem, eller vårt globala filsystem, Stockyard, och andra filsystem över hela landet. Vi vill ha ett gränssnitt som är lätt att komma åt och manipulera i andra program."

    En annan funktion Tapis kommer att erbjuda är en ny säkerhetskärna, som fungerar som en grind som styr åtkomst till systemresurser. Tapis säkerhetskärna kommer att decentraliseras, gör det möjligt för forskare att lättare ställa upp sina egna applikationer och behålla lokal kontroll över konfidentiell data.

    "Den nya säkerhetskärnan tillåter oss att erbjuda all hanterad säkerhet, autentisering, och auktorisationer som har gjorts tidigare, " sa Co-PI Sean Cleveland, en cyberinfrastrukturforskare vid University of Hawaii. "Men det kommer också att tillåta datacenter och institutioner att distribuera sin egen säkerhetskärna, så att de kan använda sina egna användaruppgifter och hantera sin egen säkerhet på sitt eget sätt, samt distribuera enskilda komponenter av ramverket vid sin institution, och kunna utnyttja en del av det centraliserade arbetet. Det är en ny, hybridsystem för att använda science-as-a-service, plattform-som-en-tjänst, men om du vill ha mer kontroll och anpassning, du kan distribuera mindre delar på plats och fortfarande kunna utnyttja några av de större, hanterade komponenter för olika behov."

    Tapis kommer att ge användarna möjligheten att förenkla processen att skapa applikationer, ett kraftfullt verktyg för forskare. "Om du kan programmera ett arbetsflöde och få det arbetsflödet att köras i en plattform som Tapis, som gör processen lättare eftersom alla komponenter kan prata med varandra lättare, ", sa Jacobs. "Det betyder att utredaren måste konstruera det arbetsflödet en gång. Sedan sparar de det arbetsflödet som en applikation inom Tapis-infrastrukturen och återanvänder det."

    Att spara alla parametrar i mjukvarumiljön kommer också att göra det möjligt för forskare att gå tillbaka och köra dataanalysen igen vid ett senare tillfälle, som främjar vetenskaplig reproducerbarhet.

    "Detta är verkligen ett komplett samarbete mellan TACC och University of Hawaii, " förklarade Stubbs.

    TACC tillför omfattande expertis inom högpresterande datoranvändning och i att bygga distribuerade mjukvarusystem. Komponenterna i Tapis själva kan köras på råvaror, eller vanliga servrar, även om vissa komponenter hos TACC kommer att köras på det NSF-finansierade Jetstream-molnet.

    Teammedlemmar på UH bidrar till utvecklingen, design, och Tapis-systemets arkitektur. Vad mer, de ger tillgång till ett överflöd av viktig domänforskning unik för Hawaii inom områden som klimat, hav, korallrev, mänsklig mikrobiom, och befolkningsstudier kring hälsoskillnader.

    "Att ha Tapis-projektet för oss här på Hawaii är en enorm medvetenhetshöjning för att tillämpa avancerad cyberinfrastruktur på dataintensiv vetenskap, " sa Jacobs. "Utan ett projekt som detta, många av våra utredare kanske inte är medvetna om dessa resurser."

    En av de stora milstolparna utredarna arbetar mot är en årsslutsworkshop för early adopters sommaren 2020. "Tanken är att ha workshopen dit vi bjuder in forskarna att komma, ta med sina datamängder, att hålla presentationer om deras vetenskap och användningsfall, men också för Tapis-teamet att presentera systemets kapacitet i slutet av år ett, sa Stubbs.

    "Vi är verkligen glada över att lansera det nya NSF-finansierade Tapis-projektet, " sa Co-PI Maytal Dahan, Direktör för Advanced Computing Interfaces på TACC. "Tapis kommer att förändra forskarnas produktivitet genom att underlätta upptäckten, tillgång till och användning av kraftfulla kapaciteter och tjänster för cyberinfrastruktur. Vi vill minska komplexiteten för att åstadkomma vetenskap och förbättra tiden till vetenskap genom att erbjuda en mängd säkra och robusta API-tjänster som kan stödja våra användare i en miljö med produktionskvalitet.

    TACC-teamet kommer att arbeta med olika aspekter av projektet – utveckling av en säkerhetskärna, strömmande data API:er och integration, kvalitetssäkring och kontinuerlig integrationstestning, uppsökande, utbildning och personalutveckling. Jag är verkligen stolt över laget, både på TACC och UH, och vi är alla entusiastiska över att arbeta tillsammans med forskarsamhället från början via vårt program för tidiga användare för att skapa tjänster som har en positiv inverkan på forskarsamhället."

    Tapis-projektet finansieras som en del av Cyberinfrastructure for Sustained Innovation (CSSI), ett tvärgående NSF-program som leds av Office of Advanced Cyberinfrastructure (OAC). "CSSI stöder utvecklingen av innovativ cyberinfrastruktur som gör det möjligt för forskargrupper att fortsätta och accelerera framstegen inom alla grundläggande vetenskaps- och ingenjörsdomäner som stöds av NSF, " sa doktor Stefan Robila, programdirektören i OAC som förvaltar priset. "Genom att bygga på tidigare arbete och utnyttja befintliga beräkningsresurser för ledarskap som de som finns tillgängliga på TACC, Tapis bidrar till en kontinuerlig förstärkning av den nationella cyberinfrastrukturen, samtidigt som man sänker barriärerna för att komma åt den."


    © Vetenskap https://sv.scienceaq.com