De taal van virale ontsnapping

Onderzoek Redactie VHIG (bron: Science direct)

Virale ontsnapping, het vermogen van virussen om te muteren, het menselijke immuunsysteem te ontwijken en een infectie te veroorzaken, blijft een obstakel voor de ontwikkeling van antivirale middelen en vaccins.

Om te voorspellen welke mutaties kunnen leiden tot virale ontsnapping werd in deze studie gebruik gemaakt van een machine learning-techniek voor natuurlijke taalverwerking. Het bleek dat de semantische landschappen voor respectievelijk de virussen Influenza A, HIV-1 en SARS-COV-2 virale ontsnappingsmutaties voorspelden die sequenties produceren die syntactisch correct zijn, maar effectief verschillen in semantiek en dus in staat zijn om het immuunsysteem te ontwijken.

In deze benadering wordt het modelleren van  ontsnapping aan de hand van virale sequentiegegevens vergeleken met het mechanisch leren van eigenschappen van de natuurlijke taal (zoals Engels of Japans) waarbij  woordreeksen worden gebruikt voor het coderen van complexe betekenissen en complexe (grammaticale) regels.

Om te ontsnappen moet een gemuteerd virus de besmettelijkheid en evolutionaire geschiktheid behouden – het moet een grammatica van biologische regels gehoorzamen – maar de mutant mag niet worden herkend door het immuunsysteem, wat analoog is aan een verandering in de betekenis of de semantiek van het virus.

De hypothese is dat (1) taalmodel-gecodeerde semantische verandering overeenkomt met antigene verandering, (2) taalmodel grammaticaliteit virale fitheid vastlegt, en (3) zowel hoge semantische verandering als grammaticaliteit helpen bij het voorspellen van virale ontsnapping.