Camille: IA contra la SARS-CoV-2 diseñada en Barranquilla

Identificación de anomalías durante la reacción en cadena de la polimerasa para detectar SARS-CoV-2 mediante inteligencia artificial obtenida a partir de datos simulados

La PCR con transcripción inversa (RT) en tiempo real es el estándar de oro para detectar el coronavirus 2 del síndrome respiratorio agudo severo (SARS-CoV-2), debido a su sensibilidad y especificidad, lo que satisface la demanda del creciente número de casos. La escasez de biólogos moleculares capacitados para analizar los resultados de la PCR hace que la verificación de datos sea un desafío. 

La inteligencia artificial (IA) se diseñó para facilitar la verificación mediante la detección de perfiles atípicos en las curvas de PCR causados por contaminación o artefactos. Se generaron cuatro clases de curvas de RT-PCR en tiempo real simuladas, a saber, amplificaciones positivas, tempranas, no y anormales. Se generaron y probaron modelos de aprendizaje automático (ML) utilizando pequeñas cantidades de datos de cada clase. Se utilizó el mejor modelo para clasificar los big data obtenidos por el Laboratorio de Virología de la Universidad Simón Bolívar a partir de curvas de RT-PCR en tiempo real para el SARS-CoV-2, y el modelo fue reentrenado e implementado en un software que correlacionó los datos del paciente con la prueba. y diagnósticos de IA. La mejor estrategia para la IA incluyó un modelo de clasificación binaria, que se generó a partir de datos simulados, donde los datos analizados por el primer modelo se clasificaron como positivos o negativos y anormales. Para diferenciar entre negativo y anormal, los datos se reevaluaron utilizando el segundo modelo. 

En el primer modelo, los datos requerían un preanálisis a través de una combinación de atractivo. La primera clase de amplificación se eliminó de los modelos porque el número de casos en big data era insignificante. Los modelos ML se pueden crear a partir de datos simulados utilizando la información mínima disponible. Durante el análisis, se pueden incorporar cambios o variaciones generando datos simulados, evitando la incorporación de grandes cantidades de datos experimentales que abarquen todos los cambios posibles. Para diagnosticar el SARS-CoV-2, este tipo de IA es fundamental para optimizar las pruebas de PCR porque permite un diagnóstico rápido y reduce los falsos positivos. Nuestro método también se puede utilizar para otros tipos de análisis moleculares.

Perfil de la curva de data HEX identificada como normal por CAMILLE:

Perfil de la curva de data HEX identificada con anomalías por CAMILLE:

El problema radica cuando son muchas muestras que hay que revisar por parte de los directores de laboratorios, cuando CAMILLE detecta una anomalía marca la intercepción del canal y el paciente específico, donde se debe revisar para tomar la decisión.