Skadad inskription:ett dekret om Akropolis i Aten (485/4 fvt). IG I 3 4B. (CC BY-SA 3.0, WikiMedia)
Djup inlärning kan hjälpa forskare att återställa antika grekiska texter. Specifikt, forskare vid University of Oxford (Thea Sommerschield och professor Jonathan Prag) och DeepMind (Yannis Assael) byggde Pythia, träna ett neuralt nätverk för att gissa saknade ord eller tecken från grekiska inskriptioner.
Dessa var på ytor inklusive sten, keramik och metall. De var mellan 1500 och 2600 år gamla. Ny vetenskapsman rapporterade att AI slog människor genom att dechiffrera skadade tabletter.
"I ett head-to-head test, där AI försökte fylla luckorna i 2949 skadade inskriptioner, mänskliga experter gjorde 30 procent fler misstag än AI. Medan experterna tog 2 timmar att komma igenom 50 inskriptioner, Pythia gav sina gissningar för hela kohorten på några sekunder."
Börjar, författarna visste att det var en tidskrävande uppgift att återställa text - även för sakkunniga epigrafister. De satte sig för att utvärdera svårigheten med den aktuella restaureringsuppgiften – och därigenom bedöma effekten av vårt arbete – med hjälp av två doktorander med epigrafisk expertis. De lärda fick använda träningssetet för att söka efter "paralleller".
.
Gege Li skrev i fredags i Ny vetenskapsman . AI:n verkar vara bättre än människor på att fylla i saknade ord, men detta är ingen lag A mot Lag B tävling. Snarare, AI-tekniken, sa Li, "kan vara mest användbar som ett samarbetsverktyg, där forskare använder det för att begränsa alternativen."
Många forntida inskrifter har blivit eroderade eller skadade under århundradena. Författarna sa att "Bara en liten minoritet av överlevande inskriptioner är fullt läsbara och fullständiga."
Med textavsnitt förlorade, hur kan man försöka fylla i tomrummen med saknade ord? Som Li sa, det skulle innebära att titta på resten av inskriptionen och titta på andra liknande texter.
Överväga Ny vetenskapsman s rapport om vad AI, kallad Pythia, kunde göra:(1) Pythia lärde sig att känna igen mönster i 35, 000 reliker, med över 3 miljoner ord. (2) Mönster som den tar upp inkluderar sammanhanget där olika ord förekommer, grammatiken, och även formen och layouten på inskriptioner.
Framgången återspeglas i titeln på deras artikel som nu finns uppe på arXiv:"Återställande av antik text med hjälp av djupinlärning:en fallstudie om grekisk epigrafi."
För att hjälpa epigrafisten, Pythia ger inte bara den lärde en enda förutsägelse. Snarare, det returnerar flera förutsägelser samt nivån av förtroende för varje resultat.
"Specifikt, vi tillhandahåller en uppsättning av de 20 bästa förutsägelserna avkodade med hjälp av strålsökning." Med 20 förslag för att fylla tomrummet, det är upp till personen att välja den bästa. "Det handlar om hur vi kan hjälpa experterna, sade Assael. För att vara säker, deras ståndpunkt är att Pythia kan fungera som en hjälpmetod i digital epigrafi.
Encylopaedia Brittanica:Epigrafi är "studiet av skriftligt material inspelat på hårt eller hållbart material. Författarna gav på samma sätt en definition. De påstod att "Epigrafi är studiet av dokument, 'inskriptioner', skrivet på en hållbar yta (sten, keramisk, metall) av individer, grupper och institutioner från det förflutna."
Teamet pratade om Pythias framtida potential, och de påpekade att det är kombinationen av maskininlärning och epigrafi som har potential att på ett meningsfullt sätt påverka studiet av inskrivna textkulturer.
"Genom öppen källkod till PYTHIA, och PHI-ML:s processpipeline, vi hoppas kunna hjälpa framtida forskning och inspirera till ytterligare tvärvetenskapligt arbete."
Varför deras forskning är viktig:Pythia, de skrev, är "den första antika textåterställningsmodellen som återställer saknade tecken från en skadad textinmatning med hjälp av djupa neurala nätverk." Författarna tror att Pythia "sätter toppmoderna i forntida textrestaurering."
Fakulteten för klassiker vid universitetet i Oxford kommenterade på liknande sätt Pythias styrkor. "Arkitekturen fungerar på både karaktärs- och ordnivå, därigenom effektivt hantera långsiktig kontextinformation, och effektivt hantera ofullständiga ordrepresentationer. Detta gör det tillämpligt på alla discipliner som behandlar antika texter (filologi, papyrologi, kodikologi) och gäller för alla språk (gamla eller moderna)."
Fakulteten för klassiker vid University of Oxford sa att en Python-anteckningsbok online, Pythia, och PHI-ML:s processpipeline har öppnats på GitHub.
Med ursprung i London 2010, DeepMind, under tiden, befinner sig i frontlinjen för forskningen om artificiell intelligens.
© 2019 Science X Network