Civilisationen i Indus River Valley anses vara en av de tre tidigaste civilisationerna i världshistorien, tillsammans med Mesopotamien och Egypten. Större geografiskt än de två när den utvecklades med början 3300 f.Kr. över det som nu är Pakistan och Indien, Indus-civilisationen stoltserade med enhetliga vikter och mått, skickliga hantverkare, ett mångfacetterat system för handel och handel och uppemot 500 symboler och tecken för kommunikation.
Men en fråga har irriterat forskare i årtionden och hindrat försök att lära sig mer om denna civilisation:Var dessa karaktärer ett språk eller mer besläktade med piktogram? Även när vissa experter börjar översätta skriptet från höger till vänster som finns i Indus-inskriptioner, råder det lite enighet.
"Det är en kontrovers som ännu inte är avgjord", säger Debasis Mitra, en professor i datavetenskap som nu är kopplad till detta uppdrag tack vare ett nytt stipendium som han tilldelades från National Endowment for the Humanities:"Ancient Script Digitalization and Archival ( ASDA) från Indus Valley Artifacts using Deep Learning."
Doktorandassistenten Deva Atturu, som kommer att försvara sin masteruppsats i april, hjälper Mitra att genomföra den anslagsfinansierade forskningen. Bara denna månad deltog han och Mitra praktiskt taget i South Asian Archaeology Conference 2024 från University of Chicago, där Atturu presenterade sitt arbete.
Skrifterna de studerar kan vara en serie symboler som motsvarigheten till dollartecken och affärstransaktionsbilder, eller dessa symboler kan vara grafem, de enskilda bokstäverna eller grupperna av bokstäver som representerar talljud.
"Båda sidor har mycket starka argument", sa Mitra.
Han är inte ute efter att lösa argumentet utan att ge dem som vill genom att utveckla en maskininlärningsalgoritm för att identifiera och digitalisera Indus-civilisationens uråldriga manus. Det finns en brist på digitaliserad data som Mitra hoppas kunna ta itu med.
Processen använder ett automatiserat skriptigenkänningssystem (ASR) för att extrahera kodade sekvenser av grafem från en datauppsättning med mer än 1 000 fotografier av Indus-sälar. Genom att använda tvåstegs artificiella neurala nätverk har ASR uppnått 88 % framgång i att upptäcka grafem.
Ändå har processen varit utmanande. Ofta bemyndigas maskininlärning genom att mata in enorma mängder data för att i princip träna systemet. I det här fallet finns det dock inte mycket data att ange. Och vilken data som finns kan ibland vara "bullrig" eller förvrängd.
"Jag arbetar med medicinsk bildbehandling och några av utmaningarna är liknande," sa Mitra.
Mitra tillämpar olika maskininlärningselement i projektet för att försöka generera ny data eller se om ett annat tillvägagångssätt kan fungera bättre. Och han befinner sig också på konferenser som inte brukar vara på schemat för datavetare, som förra årets årliga konferens i Sydasien som arrangerades av University of Wisconsin i Milwaukee, där han presenterade detta maskininlärningsprojekt.
Att delta i dessa håller honom i kontakt med arkeologer som kan ge honom mer data. "Jag går till dessa konferenser och försöker prata med dem", sa han.
Han tar också hjälp av studenter vid Indian Statistical Institute i sitt hemland Indien. Tillsammans gör de framsteg. De kan digitalisera vissa motiv och grafem och, beroende på mängden data, till och med skapa ett manus. Att göra det och få in det i en databas är målet för den initiala bidragsfinansieringen.
Nästa fas? Skapa ett system som gör att arkeologer i fält kan ta ett smartphonefoto av en text eller symboler och få det dirigerat till databasen för digitalisering.
Att dessa ansträngningar är utformade för att hjälpa till att belysa och bättre förstå en av de stora civilisationerna i hans lands historia är ytterligare motivation för Mitra.
"Det är en del av min historia, så det finns extra motivation för det. Och uppenbarligen ser jag att indiska studenter är väldigt intresserade av samma anledning", sa han. "Men ett av de första genombrotten var av ett par amerikanska studenter som hade stort intresse för Indien, och några av dem sa att de besökte Indien efteråt."
Tillhandahålls av Florida Institute of Technology