Big data y un nuevo software para la detección rápida del linfoma
El diagnóstico exacto de una persona con cáncer, su grado y su tipo concreto marca una gran diferencia entre el éxito o fracaso del tratamiento. Para ayudarse a ello, el oncólogo, a día de hoy, podría extraer docenas de casos similares uno a uno y los casos de éxito que han tenido. Ahora, sin embargo, el trabajo puede tornarse mucho más fácil gracias a un software específico que ha desarrollado un equipo de investigadores del Laboratorio de Ciencias de la Computación e Inteligencia Artificial del MIT.
Gracias a este modelo, que han desarrollado los doctores Yuan Luo y Peter Szoloyits, trabajando con el equipo del Hospital General de Masachusetts (MGH), al médico se le podrá sugerir automáticamente el subtipo de linfoma que tiene el paciente gracias al aprendizaje del software de miles de datos recopilados sobre otras patologías similares del pasado. El trabajo ha sido ahora publicado en la Asociación Americana de Informática Médica.
Para desarrollarlo, los investigadores se centraron en los 3 subtipos de linfoma más frecuentes, a pesar de que se trata de un cáncer común con más de 50 subtipos distintos que, a menudo, son difíciles de distinguir. Según Efrain Hochberg, director del centro para el Linfoma en el MGH y uno de los autores del artículo, más del 5% a 15% de los casos de este cáncer son inicialmente mal diagnosticados o clasificados, lo que puede ser un problema importante ya que cada linfoma requiere un tratamiento radicalmente distinto.
SERÍA MÁS PRECISO QUE LAS DIRECTRICES DE LA OMS
Hasta 2001, había cinco grupos diferentes de directrices para el diagnóstico de los linfomas. En ese año fue cuando la Organización Mundial de la Salud (OMS) publicó una clasificación del consenso tras un trabajo intensivo que incluyó un comité de dirección de ocho miembros y más de 130 oncólogos y hematólogos de todo el mundo. Además, se revisaron alrededor de 1.400 casos de Europa y Norte América para delimitar 50 subtipos, lo que en parte significa que los criterios de diagnóstico de estos subtipos se basan en el análisis de un número limitado de personas.
“Es importante garantizar que las directrices de clasificación son hasta el día de hoy precisas y resumen de un gran número de casos de pacientes. Pero nuestros peines de trabajo a través de casos médicos detallados podrá ayudar a los médicos a hacer un diagnóstico más integral y conocer las sutiles distinciones entre los linfomas”, expone Luo.
EL “SANFT” REVOLUCIONARIO
La principal contribución de este trabajo, según dicen los investigadores, es la técnica conocida como SANTF (Subgraph Augmented Non-negative Tensor Factorization), que es la base de datos que cuenta con más de 800 casos médicos organizados en una tabla organizada en tres parámetros correspondientes al: conjunto de los pacientes, el conjunto de subgrafos frecuentes y la colección de palabras que aparecen asociada a cada elemento de los datos mencionados en el informe. El esquema agrupa a cada uno de estos parámetros simultáneamente, utilizando para ello las relaciones en cada uno para limitar las de los otros. Mediante un examen de las agrupaciones resultantes, los investigadores pueden asociarlas a los distintos subtipos de linfoma.
"Nuestro objetivo final es ser capaz de enfocar estas técnicas en muy grandes cantidades de datos linfoma, del orden de millones de casos", dice Szolovits. "Si podemos hacer eso e identificar las características que son específicas de los diferentes subtipos, entonces nos gustaría ir más allá hacia la el trabajo más fácil de los médicos, y tal vez de los pacientes, para que puedan vivir más tiempo".