TOKIO, Japón – Los avances científicos a menudo se han visto frenados por la necesidad de grandes cantidades de datos, que pueden ser costosos, llevar mucho tiempo y, en ocasiones, difíciles de recopilar. Pero puede haber una solución a este problema si estudiamos cómo nuestros cuerpos combaten las enfermedades: una nueva técnica de aprendizaje automático llamada MotifBoost. Este enfoque puede ayudar a interpretar los datos de los receptores de células T (TCR) para identificar infecciones previas con patógenos específicos. Al centrarse en una colección de secuencias de aminoácidos cortas en los TCR, un equipo de investigación logró resultados más precisos con conjuntos de datos más pequeños. Este trabajo puede arrojar luz sobre cómo el sistema inmunitario humano reconoce los gérmenes, lo que puede conducir a mejores resultados de salud.

TOKIO, Japón – Los avances científicos a menudo se han visto frenados por la necesidad de grandes cantidades de datos, que pueden ser costosos, llevar mucho tiempo y, en ocasiones, difíciles de recopilar. Pero puede haber una solución a este problema si estudiamos cómo nuestros cuerpos combaten las enfermedades: una nueva técnica de aprendizaje automático llamada MotifBoost. Este enfoque puede ayudar a interpretar los datos de los receptores de células T (TCR) para identificar infecciones previas con patógenos específicos. Al centrarse en una colección de secuencias de aminoácidos cortas en los TCR, un equipo de investigación logró resultados más precisos con conjuntos de datos más pequeños. Este trabajo puede arrojar luz sobre cómo el sistema inmunitario humano reconoce los gérmenes, lo que puede conducir a mejores resultados de salud.

La reciente pandemia ha puesto de relieve la importancia de la capacidad del cuerpo humano para defenderse de las amenazas emergentes. El sistema inmunitario adaptativo utiliza células especializadas, incluidas las células T, para preparar una variedad de receptores diferentes que pueden reconocer antígenos específicos de los gérmenes invasores incluso antes de que lleguen. Por lo tanto, la diversidad de los receptores es un tema importante de investigación. Sin embargo, la correspondencia entre los receptores y los antígenos que reconocen suele ser difícil de determinar experimentalmente, y los métodos informáticos actuales suelen fallar si no se les proporcionan suficientes datos.

Ahora, los científicos del Instituto de Ciencias Industriales de la Universidad de Tokio han desarrollado un nuevo método de aprendizaje automático que puede predecir la infección de un donante basándose en datos limitados de los TCR. «MotifBoost» se centra en segmentos muy cortos, los llamados k-mers, en cada receptor. Aunque los motivos de proteínas que observan los científicos suelen ser mucho más largos, el equipo descubrió que extraer la frecuencia de cada combinación de tres aminoácidos consecutivos era muy eficaz. “Nuestros métodos de aprendizaje automático entrenaron

en conjuntos de datos pequeños puede complementar los métodos de clasificación convencionales que solo funcionan en conjuntos de datos muy grandes”, dice el primer autor Yotaro Katayama. MotifBoost se inspiró en el hecho de que diferentes personas suelen producir TCR similares cuando se exponen al mismo patógeno.

Primero, los investigadores aplicaron un enfoque de aprendizaje no supervisado que clasificó automáticamente a los donantes en función de los patrones encontrados en los datos y mostró que los donantes formaban grupos distintos utilizando la distribución k-mer basada en la infección previa por citomegalovirus (CMV) o no. Debido a que los algoritmos de aprendizaje no supervisados ​​no tienen información sobre qué donantes han sido infectados con CMV, este resultado indicó que la información de k-mer es eficaz para detectar las características del estado inmunitario de un paciente. Luego, los científicos utilizaron los datos de distribución de k-mer para una tarea de aprendizaje supervisado, en la que el algoritmo recibió los datos de TCR de cada donante, junto con las etiquetas para las que los donantes estaban infectados con una enfermedad en particular. Luego, se entrenó el algoritmo para predecir la etiqueta para muestras invisibles y se probó el rendimiento de la predicción en CMV y VIH.

“Descubrimos que los métodos de aprendizaje automático existentes pueden sufrir inestabilidad de aprendizaje y precisión reducida cuando la cantidad de muestras cae por debajo de un cierto tamaño crítico. Por el contrario, MotifBoost se desempeñó igual de bien en el conjunto de datos grande y aun así se desempeñó bien en el conjunto de datos pequeño”, dice el autor principal Tetsuya J. Kobayashi. Esta investigación puede conducir a nuevas pruebas para la exposición viral y el estado inmunitario en función de la composición de las células T.

Esta investigación se publica en Fronteras en Inmunología como «El estudio comparativo de los métodos de clasificación del repertorio revela la eficiencia de los datos de la extracción de características k-mer» (DOI: 10.3389/fimmu.2022.797640).

Acerca del Instituto de Ciencias Industriales de la Universidad de Tokio

El Instituto de Ciencias Industriales de la Universidad de Tokio (UTokyo-IIS) es uno de los institutos de investigación relacionados con la universidad más grandes de Japón. Más de 120 laboratorios de investigación, cada uno dirigido por un miembro de la facultad, conforman el UTokyo-IIS, que cuenta con más de 1200 miembros (unos 400 miembros del personal y 800 estudiantes) que participan activamente en la educación y la investigación. Sus actividades cubren casi todas las áreas de la ingeniería. Desde su creación en 1949, UTokyo-IIS ha trabajado para cerrar las enormes brechas que existen entre las disciplinas académicas y las aplicaciones del mundo real.


DEJA UNA RESPUESTA

Por favor ingrese su comentario!
Por favor ingrese su nombre aquí