• Home
  • Kemi
  • Astronomien
  • Energi
  • Naturen
  • Biologi
  • Fysik
  • Elektronik
  •  science >> Vetenskap >  >> Biologi
    Konstgjorda neurala nätverk kan göra det möjligt att samla naturhistoriska samlingar

    Smithsonian -forskare som klassificerar digitaliserade herbariumark som har färgats med kvicksilver för att bygga en träningsdataset. Upphovsman:Paul B. Frandsen, Smithsonian

    Miljoner, om inte miljarder, exemplar finns i världens naturhistoriska samlingar, men de flesta av dessa har inte studerats noggrant, eller ens tittat på, på årtionden. Medan den innehåller kritisk data för många vetenskapliga strävanden, de flesta föremål sitter tyst i sina egna små skåp av nyfikenhet.

    Således, massdigitalisering av naturhistoriska samlingar har blivit ett stort mål på museer runt om i världen. Efter att ha samlat många biologer, kuratorer, volontärer och medborgare, sådana initiativ har redan genererat stora datamängder från dessa samlingar och gett insikt utan motstycke.

    Nu, en studie, nyligen publicerad i open access Biodiversity Data Journal , föreslår att de senaste framstegen inom både digitalisering och maskininlärning tillsammans kan hjälpa museikuratorer i deras ansträngningar att ta hand om och lära av denna otroliga globala resurs.

    Ett team av forskare från Smithsonian Department of Botany, Data Science Lab, och Digitaliseringsprogramkontoret samarbetade nyligen med NVIDIA för att genomföra ett pilotprojekt med hjälp av djupinlärningsmetoder för att gräva i digitaliserade herbariumprover.

    Deras studie är bland de första som beskriver användningen av djupa inlärningsmetoder för att förbättra vår förståelse av digitaliserade samlingsprover. Det är också det första som visar att ett djupt konvolutionellt neuralt nätverk - ett datorsystem som modellerats efter neuronaktiviteten i djurhjärnor som i princip kan lära sig själva - effektivt kan skilja mellan liknande växter med en fantastisk noggrannhet på nästan 100%.

    US National Herbarium på Smithsonian's National Museum of Natural History i Washington, DC Credit:Chip Clark, Smithsonian

    I tidningen, forskarna beskriver två olika neurala nätverk som de tränat för att utföra uppgifter på den digitaliserade delen (för närvarande 1,2 miljoner exemplar) av United States National Herbarium.

    Teamet tränade först ett nät för att automatiskt känna igen herbariumark som hade färgats med kvicksilverkristaller, eftersom kvicksilver vanligtvis användes av några tidiga samlare för att skydda växtsamlingarna från insektsskador. Det andra nätet utbildades för att diskriminera mellan två familjer av växter som har ett slående liknande ytligt utseende.

    De utbildade neurala näten utfördes med 90% respektive 96% noggrannhet (eller 94% och 99% om de mest utmanande exemplen kastades), bekräftar att djupinlärning är en användbar och viktig teknik för framtida analyser av digitaliserade museisamlingar.

    Digitaliserade samlingar kombinerat med djup inlärning hjälper oss att automatisera en annars mänsklig uppgift att identifiera ett okänt antal färgade exemplarark i en samling på över 5 miljoner. Se http://collections.si.edu. Upphovsman:Smithsonian Institution

    "Resultaten kan utnyttjas både för att förbättra kuratet och låsa upp nya forskningsvägar, "avslutar forskarna.

    "Detta forskningsarbete är ett underbart bevis på konceptet. Vi vet nu att vi kan tillämpa maskininlärning på digitaliserade naturhistoriska exemplar för att lösa kuratoriska och identifieringsproblem. Framtiden kommer att använda dessa verktyg i kombination med stora delade datamängder för att testa grundläggande hypoteser om utvecklingen och spridningen av växter och djur, "säger Dr Laurence J. Dorr, Ordförande för Smithsonian Department of Botany och medförfattare till studien.


    © Vetenskap https://sv.scienceaq.com