Kredit:CC0 Public Domain
Springer Nature publicerade sin första maskingenererade bok, sammanställd med hjälp av en algoritm utvecklad av forskare från Goethe-universitetet. Detta samarbete bröt ny mark med den första maskingenererade boken som gavs ut av ett vetenskapligt förlag.
Boken ger en översikt över nya forskningspublikationer om litiumjonbatterier – en strukturerad, automatiskt genererad sammanfattning av ett stort antal aktuella forskningsartiklar. Det ger forskare en överblick över den senaste forskningen inom detta snabbt växande område, så att de kan hantera informationen effektivt. Boken finns tillgänglig som gratis nedladdning.
Processen, utvecklat under ledning av biträdande professor Christian Chiarcos med labbet Applied Computational Linguistics (ACoLi) vid Goethe University, består av olika komponenter som analyserar textinnehåll så att relevanta publikationer från innehållsplattformen SpringerLink automatiskt väljs ut och bearbetas. Dessa peer-reviewed Springer Nature-publikationer genomgår en likhetsbaserad klustring för att ordna källdokumenten i sammanhängande kapitel och avsnitt.
Kortfattade sammanfattningar av artiklarna skapas inom kapitlen. Extraherade och parafraserade stycken från källdokumenten hänvisas till med hyperlänkar som gör att läsarna kan utforska originaldokumentet ytterligare. Automatiskt skapade introduktioner, Innehållsförteckningar och referensavsnitt underlättar orienteringen i boken.
"Denna publikation har gjort det möjligt för oss att visa i vilken grad utmaningarna med maskingenererade publikationer kan lösas när experter från vetenskapliga förlag samarbetar med datorlingvister, " förklarade professor Chiarcos. "Projektet gjorde det också möjligt för oss att bättre förstå författarnas förväntningar, redaktörer, förlag och konsumenter — med hänsyn till både vetenskapliga och ekonomiska krav."
Henning Schönenberger, Director Product Data &Metadata Management på Springer Nature, tillade:"Medan forskningsartiklar och böcker skrivna av forskare och författare kommer att fortsätta att spela en avgörande roll i vetenskaplig publicering, vi förutser många olika innehållstyper i akademisk publicering i framtiden:från ännu helt mänskligt skapat innehåll till en mängd blandad man-maskin-textgenerering till helt maskingenererad text. Denna prototyp är en första viktig milstolpe vi nådde, och det kommer förhoppningsvis också att initiera en offentlig debatt om möjligheterna, implikationer, utmaningar och potentiella risker med maskingenererat innehåll i vetenskaplig publicering."