Kaolin -applikationer. Upphovsman:Murthy Jatavallabhula et al.
Eftersom de flesta verkliga miljöer är tredimensionella, djupinlärningsmodeller utformade för att analysera videor eller slutföra uppgifter i verkliga miljöer bör helst utbildas i 3D-data. Tekniska verktyg som robotar, självkörande fordon, smartphones, och andra enheter genererar för närvarande en växande mängd 3D-data som så småningom kan bearbetas med deep learning-algoritmer.
Ända tills nu, dock, Det har varit relativt svårt att träna djupinlärningsalgoritmer om denna stora mängd 3D-data, eftersom de nödvändiga verktygen och plattformarna endast är tillgängliga för vissa artificiella intelligensforskare (AI). För att ta itu med denna brist på lättillgängliga verktyg, ett team av forskare på NVIDIA har nyligen skapat Kaolin, ett PyTorch-bibliotek med öppen källkod som syftar till att främja och underlätta 3D-forskning om djupinlärning.
"För närvarande, det finns inte ett enda bibliotek med öppen källkod som stöder flera representationer av 3D-data, flera uppgifter, och utvärderingskriterier, "Krishna Murthy Jatavallabhula, en av forskarna som genomförde studien, berättade TechXplore. "Vi bestämde oss för att ta itu med denna lucka i litteraturen genom att skapa Kaolin, det första omfattande 3D-biblioteket för djupinlärning. "
Kaolin, PyTorch -biblioteket presenterat av Jatavallabhula och hans kollegor, innehåller en mängd olika verktyg för att konstruera djupinlärningsarkitekturer som kan analysera 3D-data, som är både effektiva och enkla att använda. Det gör det också möjligt för forskare att ladda, förbehandling, och manipulera 3D-data innan den används för att träna djupinlärningsalgoritmer.
Kaolin innehåller flera grafikmoduler för att redigera 3D-bilder, med funktioner som rendering, belysning, skuggning och se vridning. Dessutom, den stöder ett brett spektrum av förlustfunktioner och utvärderingsstatistik, gör det möjligt för forskare att enkelt utvärdera sina djupinlärningsalgoritmer.
Upphovsman:Murthy Jatavallabhula et al.
"Vanligtvis, 3D-forskare med djupinlärning måste skriva en hel del pannkodskod för sina forskningsprojekt, "Jatavallabhula förklarade." Med Kaolin, dock, forskare behöver bara implementera de nya delarna av sitt projekt, som Kaolin paketerar en omfattande uppsättning verktyg för dataladdning, konvertering och utvärdering. "
Kaolin är ett värdefullt verktyg för både utvecklare som har erfarenhet av att utveckla modeller för djupinlärning och de som precis har börjat. Inom biblioteket, faktiskt, utvecklare kan också hitta flera toppmoderna arkitekturer som de kan använda som utgångspunkt eller som inspirationskälla för sina egna modeller.
"Medan aktiva 3D-forskare inom djupinlärning ser Kaolin som ett sätt att påskynda sin forskning, nykomlingar inom detta område vänder sig till Kaolin för att få en idé om var de ska börja, "Sa Jatavallabhula.
I framtiden, biblioteket med öppen källkod som presenteras av dessa forskare vid NVIDIA kan hjälpa till att påskynda 3D-djupinlärningsforskning, hjälpa utvecklare att skapa nya AI -arkitekturer, liksom i utbildning och utvärdering av dem. Under tiden, Jatavallabhula och hans kollegor planerar att arbeta med att förlänga Kaolin och förbättra dess kapacitet ytterligare.
"Vår plan är att lägga till mer djupinlärningsmodeller i vår modellpark (samling av AI-modeller) och utöka vår täckning till en bredare uppsättning applikationer som självkörande bilar och förkroppsligade agenter som behöver 3D-inlärning, "Sa Jatavallabhula." Kort sagt, Vi planerar att göra Kaolin till en enda plattform för tredimensionell djupinlärningsforskning. "
© 2019 Science X Network