Mapa web
Youtube
Instagram
Campus UNED

O profesor José Luis Aznarte amosou en Ourense o proxecto EsCOVID-19 DATA no que participa o departamento de IA da UNED

30 de abril de 2021

O doutor Aznarte di que esta iniciativa "pretende unificar os datos por provincias, datos coherentes, interoperables e accesibles, usados por científicos e xornalistas para facer o seu traballo". 

OURENSE, 29 de abril de 2021.- José Luis Aznarte iniciou o seu relatorio falando de aplicacións da  IA para a saúde. Unha delas é a identificación automática de grans de pole. Clasificar pole é unha tarefa  tediosa e non moi estimulante, que realiza normalmente PDI en formación. A utilidade disto afecta a persoas alérxicas, a recursos sanitarios e outras aplicacións.

“Automatizar o proceso de cálculo de pole aforraría moito tempo e recursos”, sinala Aznarte. Por iso indica que “desenvolvemos un sistema baseado en IA capaz de distinguir 46 especies”. En canto a outras aplicacións relacionadas co pole, o profesor di que a concentración diaria de pole de diversas especies pode ser vista como unha serie temporal. Desenvolvemos modelos de intelixencia artificial para predicir:

 

  • As concentracións futuras de pole
  • O inicio e final da estación  polínica

Outra acción é a predición da calidade do aire en Madrid. O Concello de Madrid e os cidadáns necesitan coñecer con antelación a activación de protocolo de dióxido de nitróxeno (NO2), ademais dos valores de ozono (Ou3) e partículas en suspensión. José Luis Aznarte mostrou gráficas dos niveis de dióxido de nitróxeno na Avenida Ramón e Cajal da capital así como a gráfica de probabilidade de activación do protocolo de NO2 en nivel de aviso previo/previo aviso, para o 29 e para o 30 de setembro de 2020.

Tamén se detivo na predición de ingresos hospitalarios. “A partir de datos de contaminación (NO2, Ou3, CO, PM10, SO2), de pole (gramíneas-Poaceae) e meteorolóxicas (temperatura, choiva), somos capaces de determinar con precisión o número futuro de ingresos hospitalarios por afeccións circulatorias e respiratorias”, indicou o relator.

COVID19 e predición de series temporais

O Real Decreto-Lei 8/2020, do 17 de marzo, de medidas urxentes extraordinarias para facer fronte ao impacto económico e social do COVID-19, supuxo 24 millóns de euros para subvencións a proxectos e programas de investigación do COVID-19 xestionado polo Instituto de Saúde Carlos III.O impacto esperado consistía en:

 

  • Contribuír a mellorar o tratamento da enfermidade na actual pandemia.
  • Contribuír a mellorar o diagnóstico e o manexo clínico de pacientes infectados por SARS-CoV-2.

  • Contribuír ao deseño, desenvolvemento e implantación de medidas de saúde pública para responder eficazmente á epidemia en curso de  SARS- CoV-2.

O proxecto de aplicación de IA á predición inmediata de series temporais para optimizar a xestión de recursos en epidemias obtivo un orzamento de 105 millóns de euros cun prazo de execución de seis meses. O equipo estaba formado polo Departamento de Intelixencia Artificial da UNED, Inverence, expertos en desenvolvemento de sistemas preditivos da demanda e a creación de sistemas de  pricing e Populate, expertos en análises de datos e visualización interactiva.w2

O profesor Aznarte sinala como consideracións xerais dos modelos preditivos coñecer o propósito dos devanditos modelos, se se trata de predición a curto prazo ou proxeccións de escenarios futuros; coñecer as asuncións básicas, "que asumimos sobre inmunidade, transmisión asintomática e como se modelan os contactos. Tamén é necesario saber como se manexa a incerteza e como se calculan os rangos das predicións ou dos parámetros. Necesario é saber igualmente cales son os datos nos que nos baseamos, se son fiables, por exemplo, casos confirmados  versus hospitalizados/falecidos. Do mesmo xeito hai que saber se é un modelo xeral ou para un contexto concreto e se a escala espacial (nacional, rexional, local) é adecuada para o propósito do modelo. Tamén hai que ter en conta como afecta a escala ás asuncións, por exemplo mobilidade".

 

Modelos  mecanísticos baseados en ecuacións, familia SIR:

  • Por medio de información detallada sobre o tamaño e a densidade de poboación, a idade media, o tamaño da rede social, o sistema sanitario & c, xérase unha «copia virtual» dunha cidade, rexión ou país.
  • Calcúlanse ecuacións diferenciais que gobernan as interaccións da poboación no espazo e no tempo.

  • Require información crave e difícil de estimar ao principio como a proporción de falecidos ou o número básico de reprodución ( R0). Destes parámetros depende a bondade do modelo.

  • Permiten a elaboración de escenarios a medio prazo mediante a variación nos parámetros iniciais.

Modelos baseados puramente en datos:

  • A partir da evolución das series temporais de interese, os modelos «aprenden» do pasado da epidemia e predín o comportamento a curto prazo.
  • Non requiren coñecemento epidemiolóxico a priori.

  • É necesario dispoñer de grandes volumes de datos.

Modelos mixtos:

  • A partir dos datos son capaces de axustar os parámetros de modelos mecanísticos.
  • Por exemplo, axuste dinámico do R0 nun modelo SIR.Teñen estrutura de base teórica pero poden representar o contaxio de modo dinámico.
  • Os datos son neste modelo esenciais pero a estrutura do modelo está fixada conforme á teoría epidemiolóxica.

Na predición de series temporais de  COVI-19 existen dificultades e ameazas. Estamos #ante un escenario cambiante, con prioridades e obxectivos en ocasións incertos. Hai decisións políticas que afectan á solidez dos datos e unha falta de homoxeneidade, por exemplo, en saber que é un caso pois, como sinala o relator:

  • Hai catro tipos de criterios: clínicos, de radiodiagnóstico, de laboratorio ou epidemiolóxicos (segundo o European Centre for Disease Prevention and Control)
  • Casos “posibles”, “probables” ou “confirmados”.

  • Hai quen considera casos aos probables+confirmados.

  • Diversidade de tests: PCR, PCR en saliva, antíxenos, anticorpos.

  • Precisión dos tests: falsos positivos e falsos negativos.

Cos datos hai:

  •  Problemas de agregación:
    • Espacial: cada Comunidade Autónoma comunica os datos dunha maneira. 

    • Temporal: os datos non se comunican sempre coa mesma regularidade.
  • Tamén hai notificacións con retardos.
  • Non se garantiza a continuidade das series.

  • Datos en dispersos, incoherentes e en formatos non interoperables.

  • Faltan datos esenciais:
    • Camas UCI: datos de 2017 (Estadística de Centros Sanitarios de Antención Especializada, SIAE).
    • Movilidade (datos non públicos: operadoras de telefonía).

    • Densidade habitada (número de habitantes por km2 habitado).

    • Capacidade diagnóstica.

    • Capacidade de rastrexo.

O proxecto denomínase EsCOVID-19DATA, resultado dun esforzo colectivo, distributivo, voluntario e espontáneo. Pretende unificar os datos por provincias, datos coherentes, interoperables e accesibles, usados por científicos e xornalistas para facer o seu traballo. Integran fontes de datos moi diversas e un exemplo é a ciencia aberta. En canto aos avances realizados, nos modelos preditivos actuais de series temporais de COVID-19: 

  •  Para confirmados, hospitalizados, ingresados UCI e falecidos, armáronse modelos univariantes de series temporais conanálisis de intervencións: ARIMA bayesianos.
  •  Estamos a traballar en modelos en fervenza que permitan integrar regresión non lineal (redes neuronais). Para exceso de mortalidade, creouse un modelo de agregación que combina a información semanal do INE coa información diaria do Sistema de Monitoraxe da Mortalidade diaria (MoMo) para xerar predicións diarias (de momento só por CCAA, pronto tamén por provincia). 

José Luis Aznarte mostrou, para rematar o seu relatorio, unha listaxe de predición por comunidades autónomas moi completo e terminou a súa intervención referíndose aos pasos futuros neste campo, que pasan por refinar a escala espacial: predición por municipios, distritos sanitarios/hospitais, facer unha posta de servizo de acordo co Centro Nacional de Epidemiología ( ISCIII) e o Centro de Coordinación de Alertas e Emerxencias Sanitarias (CCAES) e refinar os modelos con novas variables: procuras na internet, vulnerabilidade,densidade de poboación, capacidade diagnóstica, augas residuais,mobilidade, e con novas arquitecturas de redes neuronais: redes neuronais espacialmente agnósticas, ConvLSTM… Este ciclo de conferencias que forman o seminario organizado pola UNED para Ourense, emítense desde o Centro de Intelixencia Artificial da cidade e contan co apoio económico do Vicerreitorado de Investigación, Transferencia do Coñecemento e Divulgación Científica da UNED.

 Podes ver en diferido o relatorio de José Luis Aznarte aquí.

UNED Ourense

Comunicación

Carretera de Vigo Torres do Pino  s/n Baixo 32001 Ourense - . Tel. 988371444 info@ourense.uned.es