Chansen är stor att du antingen har skickat eller tagit emot ett meddelande som var förvirrat tack vare autokorrigering eller autoslutförande. Det finns hundratals memes där dessa fel orsakar felkommunikation, ofta med roliga resultat. Som den här. Eller den här. Eller den här.
Men det är inte så roligt när det händer med din vetenskapliga uppsats. Akademiska uppsatser innehåller ofta kompletterande filer med data, diagram och grafer som stödjer uppsatsens slutsats. Många av dessa filer är kalkylblad.
Sedan 2004 har forskare har märkt att Microsoft Excel, det populära kalkylprogrammet, har en dålig vana att ändra vissa gennamn till andra typer av data. Till exempel, genetiker använder MARCH1 som stenografi för membranassocierat finger av ring-CH-typ 1. Men Excel tolkar MARCH1 som ett datum, automatiskt konvertera den till 1-mar eller annan beteckning för första mars.
Excel felidentifierar några andra gennamn som koordinater eller flytande punkter. Du kanske kan förstå att 1-mars faktiskt är 1 mars, men vad sägs om 2.31E+13? Det är så Excel konverterar RIKEN -identifieraren 2310009E13. RIKEN är ett massivt forskningsinstitut i Japan som, bland annat, genomför genomprojekt. (För protokollet, vi försökte ansluta RIKEN -identifieraren till ett Excel -kalkylblad och fick den automatiskt konverterad till 2.31E+19, fortfarande fel och fortfarande inte vad som är avsett i de akademiska uppsatserna.)
Trots att forskarna först identifierade detta problem för mer än ett decennium sedan, det kvarstår idag. Forskarna Mark Ziemann, Yotam Eren och Assam El-Osta visade mer än 35, 000 kompletterande filer för att se hur utbrett problemet faktiskt var. De utvecklade automatiserad programvara som sökte efter data som såg ut att kunna vara en lista med gennamn. De identifierade 7, 467 genlistor som representerar kompletterande data för 3, 597 publicerade artiklar i 18 olika tidskrifter. Det visade sig att 704 av de publicerade artiklarna innehöll filer med Excel -formatfel i dem. Det är en nedgång på 19,6 procent. Med andra ord, nästan en av fem publicerade artiklar innehåller kompletterande filer med Excel -formateringsfel i dem.
Detta är inte bara en olägenhet. Forskare förlitar sig på publicerade verk för att styra sina egna projekt. Om filerna innehåller fel, Det kan vara svårt och tidskrävande att reda ut problemet och hitta relevant data.
Varför inte bara stänga av funktionerna för automatisk formatering? Enligt forskargruppen, det finns inget sätt att permanent inaktivera funktionerna i Excel. Du kanske kan ändra varje alternativ manuellt varje gång du skapar en ny fil, men det är ineffektivt. De påpekade, dock, att Google Kalkylark inte följer samma metod för formatering. Vad mer, om du först lägger in all din data i Google Kalkylark och sedan kopierar den till ett annat kalkylprogram, formateringen förblir orörd.
Det är lite komiskt att en funktion som är avsedd att hjälpa människor att använda kalkylblad orsakar en sådan huvudvärk i akademiska kretsar. Kanske kommer framtida versioner av Excel att innehålla ett alternativ för att inaktivera autoformateringsfunktioner på obestämd tid. Tills dess, genetiker bör dubbelkolla sitt arbete eller överväga att byta till Google Kalkylark.