Kredit:University of California - San Diego
I majnumret av PLOS Computational Biology , forskare från UC San Diego och University of Notre Dame rapporterar om en studie som kan öppna fältet för nanoporbaserad proteinidentifiering – och så småningom proteomisk profilering av ett stort antal proteiner i komplexa blandningar av olika typer av molekyler.
Enligt UC San Diego datavetenskap och ingenjörsprofessor Pavel Pevzner, senior författare på tidningen, det nya tillvägagångssättet identifierar proteiner genom att analysera de distinkta elektriska signalerna som produceras när molekylerna passerar genom en nanopor (som fungerar som en såll). I teorin, sa Pevzner, nanoporer kan tillåta forskare att karakterisera ett stort antal proteiner i komplexa blandningar.
Medan nanoporer fungerar extremt bra för att analysera enstaka molekyler, de är mindre effektiva när man försöker karakterisera ett stort antal proteiner i komplexa blandningar. Som ett resultat, det för närvarande föredragna tillvägagångssättet för att screena komplexa blandningar innefattar användning av andra tekniker, särskilt masspektrometri. (Pevzner och datavetenskapsprofessorerna Vineet Bafna och Nuno Bandeira är huvudutredare för det NIH-finansierade Center for Computational Mass Spectrometry vid UC San Diego.)
Så sent som 2016, ledande nanopore-utvecklare var pessimistiska om att kunna tillämpa nanoporer på storskalig proteinprofilering på kort sikt. "Vi är inte ens i närheten av att göra det för tillfället, "Oxford Nanopores medgrundare Hagan Bayley berättade för GenomeWeb, och tillägger att han "inte skulle säga att det är ett omöjligt mål, men det är lite av en sträcka."
UC San Diegos Pevzner, dock, anser att ett genombrott är nära. "Nyckeln är att använda maskininlärning för att analysera information som genereras av proteiner när de translokerar genom en nanopor, ", sa Pevzner. "Genom att tillämpa maskininlärningstekniker, vi kunde identifiera distinkta signaler som kunde leda till storskalig analys av nanoporeprotein."
I en intervju med GenomeWeb, Pevzner säger att tidigt på, hindren verkade svårlösta. "Datan var så bullrig att vi nästan trodde att vi skulle ge upp, " förklarade han. "Jag har arbetat i nästan 10 år nu med top-down masspektrometri, och i jämförelse med proteinidentifiering genom top-down masspektrometri, som vid det här laget nästan är ett moget område, det såg ut som att det inte fanns något hopp om att nanoporer skulle kunna producera en jämförbar signal."
Sedan, när forskarna använde ett slumpmässigt skogsanalysverktyg från maskininlärning till problemet, allting förändrades. Minns Mikhail Kolmogorov, en doktorand i Pevzners labb:"Helt plötsligt, strukturen för signalen uppstod."
Som det står i PLOS-tidningen, forskarna hävdar att "den nuvarande tekniken är redan tillräcklig för att matcha nanospektra mot små proteindatabaser, t.ex., proteinidentifiering i bakteriella proteomer."