• Home
  • Kemi
  • Astronomien
  • Energi
  • Naturen
  • Biologi
  • Fysik
  • Elektronik
  •  science >> Vetenskap >  >> Kemi
    Programvara för maskininlärning förutsäger bakteriers beteende

    En konstnärs skildring av en bakteriecell. Kredit:Centers for Disease Control and Prevention/James Archer

    I en första för maskininlärningsalgoritmer, en ny mjukvara utvecklad på Caltech kan förutsäga bakteriers beteende genom att läsa innehållet i en gen. Genombrottet kan få betydande konsekvenser för vår förståelse av bakteriell biokemi och för utvecklingen av nya mediciner.

    En inriktning av modern farmakologi är fokuserad på att lindra åkommor genom att utveckla läkemedel som riktar sig mot specifika proteiner som finns i membranen i våra kroppars celler. Dessa proteiner, kända som integrerade membranproteiner (IMP), fungerar som receptorer eller "portar" som tillåter material in och ut ur celler. Exempel på IMP är G-proteinkopplade receptorer, som vidarebefordrar information till en cell om dess miljö, och jonkanaler, som styr cellens inre miljö genom att fungera som grindvakter som selektivt låter joner passera in och ut ur cellen. IMP är måltavlan för nästan 50 procent av alla läkemedel på marknaden. Tyvärr, många IMP är dåligt förstådda.

    "Det här är mycket viktiga molekyler som vår kropp gör som vi helt enkelt inte vet tillräckligt om, säger Bil Clemons, professor i biokemi vid Caltech.

    För att få en mer fullständig förståelse för en IMP, forskare måste generera stora mängder av det för rening och detaljerade studier. Vanligtvis, det görs genom att sätta in DNA:t för proteinet i bakterier; proteinet produceras sedan som en självklarhet när bakterierna växer och förökar sig. Problemet är att inte alla bakterier är villiga att samarbeta och tillverkar endast ynka mängder protein. Endast ett fåtal bakterier gör tillräckligt mycket av proteinerna för att vara användbara, och, tills nu, det har inte funnits något sätt för forskare att veta om en bakterie de arbetar med kommer att bli en hit eller en dud.

    "En av de största begränsningarna för att studera membranproteiner är bristen på förmåga att uttrycka dem i rimliga mängder, " säger Clemons. "Vi använder dessa bakterier som fabriker för att göra saker åt oss, men det är hit or miss ... mest miss. Anekdotiskt, det har varit cirka 10 procent framgångsrikt."

    Allt trial and error som ingår i att få bakterier att samarbeta slösar forskarnas tid och resurser. Clemons undrade om det skulle vara möjligt att använda datorer för att förutsäga hur bakterier kommer att reagera när de ombeds skapa ett protein som de normalt inte producerar.

    "Vi antog att bakterieceller gjorde en kvantitativ avläsning av DNA:t för att avgöra hur mycket av dessa proteiner som skulle göras, " säger han. "Vi ville veta om vi kunde använda beräkningsverktyg för att öka framgångsfrekvensen för att hitta bakterier som uttrycker proteiner i användbara mängder för att hjälpa oss karakterisera molekyler som är viktiga för medicinen."

    Clemons och hans doktorand, Shyam Saladi, skapade det verktyget – en maskininlärningsprogramvara som de har kallat IMProve – som jämför bakteriellt DNA med data om hur mycket protein bakterierna producerar. De använde sedan en dataset för IMProve som odlade många prover av bakterier för att se hur väl de producerade de önskade membranproteinerna. Forskarna tränade IMProve genom att mata dessa resultat och de genetiska koder som bakterierna förlitar sig på för att uttrycka proteinerna i IMProve så att de kunde lära sig vilka DNA-sekvenser som skulle resultera i hög proteinproduktion.

    När programvaran väl har tränats, forskarna fann att det förutspådde bakteriell beteende så bra att de kunde fördubbla sin takt för att framgångsrikt plocka bakterier som skulle uttrycka IMP i stora mängder.

    "Det förvånade oss eftersom det inte fanns någon garanti för att detta tillvägagångssätt skulle fungera, "Clemons säger. "Celler är extremt komplexa, och du ber en relativt enkel statistisk modell för att förutsäga vad en cell kommer att göra. Ur det perspektivet, det var ganska chockerande. "

    Men, Clemons tillägger att kanske är deras resultat inte så överraskande i efterhand.

    "Detta understryker tanken att celler bara är datorer, och de bara beräknar saker, " han säger.

    Pappret, med titeln "En statistisk modell för förbättrat membranproteinuttryck med hjälp av sekvenshärledda funktioner, " visas i numret av den 30 mars Journal of Biological Chemistry .


    © Vetenskap https://sv.scienceaq.com