Kunstmatige intelligentie in dienst van het opsporen van met het bèta-coronavirus besmette dieren

Hoe kunnen we dierpopulaties die reservoirs zijn van nieuwe zoönotische virussen, oftewel virussen die op mensen kunnen worden overgedragen, optimaal identificeren en beheersen?

Een internationaal onderzoeksteam van kunstmatige intelligentie en biologie werkt sinds het begin van de COVID-19-pandemie, veroorzaakt door SARS-CoV-2, aan het creëren van machine learning-modellen om de nauwkeurigheid te verifiëren van acht statistische modellen in hun vermogen om te voorspellen welk dier soorten fungeren als gastheer voor virussen die behoren tot het geslacht Betacoronavirus.

De resultaten van dit werk, dat mede werd geschreven door professor Timothy Boisseau van de afdeling Biologische Wetenschappen van de Universiteit van Montreal, zijn gepubliceerd in het prestigieuze tijdschrift. lancet microbe.

“Statistische modellen kunnen worden gebruikt om de prioriteit te bepalen bij het nemen van monsters van groepen dieren die mogelijk als gastheer dienen, maar voorspellingen van deze modellen kunnen zeer onzeker zijn en systematische validatie is schaars, dus hun prestaties worden onder de loep genomen”, merkt de heer Poisot op.

Het is duur om dierenpopulaties in het veld te bemonsteren om te bepalen of ze als gastheer dienen. Om autoriteiten te helpen bij het prioriteren van bemonsteringslocaties, produceerden de onderzoekers een set van acht statistische modellen die gastheervirusassociaties bij vleermuizen over de hele wereld voorspellen en deze door machine learning-modellen leiden.

Het idee was om de nauwkeurigheid van statistische modelvoorspellingen systematisch te controleren.

Twee grote modellenfamilies

Al meer dan een jaar volgt het team de ontdekking van 40 nieuwe soorten vleermuizen die het betacoronavirus dragen, en helpt het de voorspellingen van prototypes te valideren door ze bij te werken zodra nieuwe gegevens beschikbaar komen.

“We merkten in eerste instantie tot onze verbazing dat de modellen het niet met elkaar eens waren en dat ze allemaal enige vooroordelen vertoonden, zoals Timothy Boyzo beweert. Vervolgens ontdekten we dat in plaats van randomisatie de statistische modellen waren verdeeld in twee grote families , die gebaseerd op interacties of netwerken variërend van zijn voorspellingen zijn van goed tot slecht, en die gebaseerd op de kenmerken van vleermuissoorten maken goede voorspellingen.”

Om een ​​betrouwbaarder voorspellend model te creëren, heeft het onderzoeksteam de modellen “opgeschoond” en vervolgens gecombineerd tot het ensemblemodel. Een jaar later was het model in staat om wereldwijd meer dan 400 soorten vleermuizen te identificeren die mogelijk onopgemerkte gastheren zijn voor het betacoron-virus.

Epidemiologische risicokaart

“Hoewel er 20 soorten hoefijzervleermuizen zijn [Rhinolophus spp.] Het staat bekend als het belangrijkste reservoir van SARS-achtige virussen, en we ontdekten dat minstens driekwart van de redelijke reservoirs van betacoronvirus onder deze vleermuizen onopgemerkt zouden kunnen blijven”, zegt professor Boiso.

Dit verzamelmodel wordt voortdurend bijgewerkt en biedt lijsten van vleermuissoorten – en hun habitatlocaties – om prioriteit te geven aan monitoring door middel van bemonstering. Op termijn zal het mogelijk worden om epidemiologische risico’s in kaart te brengen door te verwijzen naar deze lijsten met kaarten van menselijke populaties die leven in de buurt van leefgebieden waar zoönotische ziekten kunnen uitbreken.

Timothée Poisot concludeert: “Onze studie is de eerste die door middel van systematische verificatie aantoont dat modellen voor machinaal leren kunnen worden gecombineerd om de bemonstering van dieren in het wild voor niet-gedetecteerde virussen te verbeteren.” Het laat zien hoe deze methoden het beste kunnen worden geïmplementeerd via een dynamisch proces van prognoses, gegevensverzameling, validatie en actualisering. “

Verschillende onderzoeksprojecten gaan in deze geest verder, met name door de diversiteit aan gegevensbronnen over alle zoogdieren te vergroten. Het doel is om een ​​atlas van zoogdierviromes te maken.

Het werk van een monnik!

Om betrouwbare machine learning-modellen te maken, moest het onderzoeksteam gegevens coördineren die afkomstig waren van verschillende virale monitoringsystemen over de hele wereld.

En dus hebben UdeM-masterstudenten Kwantitatieve Biologie en Informatica in maart en april 2020 monastieke werkzaamheden verricht om de namen van vleermuissoorten te corrigeren in een Excel-document met … 43.000 regels!

Leave a Comment