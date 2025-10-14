La investigación propone un enfoque bayesiano para afrontar la incertidumbre de modelo y la ausencia de datos.PIXABAY

Los datos son una herramienta fundamental en la toma de decisiones, ya que aportan una base estructurada y objetiva para la evaluación de opciones, la identificación de las tendencias y la predicción de los resultados. Sin embargo, ¿qué ocurre en el caso de que se carezcan de los datos suficientes para poder realizar este proceso? Desde este supuesto ha partido una investigación realizada por un equipo de investigación multidisciplinar conformado por cinco universidades españoles, entre ellas la Universidad de León, donde los investigadores han desarrollado una novedosa metodología estadística para ser capaces de seleccionar variables relevantes incluso cuando la información está incompleta.

El trabajo, que ha sido publicado en la prestigiosa revista Bayesian Analysis, ha abordado de forma rigurosa cómo cuantificar la incertidumbre en los modelos estadísticos empleados para representar la realidad, contemplando la posibilidad de que haya datos con valores faltantes, un supuesto habitual en análisis de datos reales y estudios científicos. En la investigación denominada ‘Model Uncertainty and Missing Data: An Objetive Bayesian Perspective’ ha participado la investigadora de la Universidad de León, Alicia Quirós.

Los autores proponen una metodología bayesiana objetiva que integra directamente la incertidumbre sobre los datos faltantes en el proceso de inferencia, en contraposición a las estrategias habituales que implican la desestimación de datos con valores faltantes o que utilizan métodos de selección de variables que arrojan falsos positivos.

Gracias a su propuesta, los investigadores aseguran que son capaces de mejorar la robustez de los modelos y evitar errores comunes en la selección de variables, por lo que se pueden obtener resultados más fiables, incluso cuando hay valores perdidos en conjuntos de datos de grandes proporciones.

Qué es un método bayesiano

Un método bayesiano es un enfoque estadístico basado en el teorema de Bayes, que describe cómo actualizar la probabilidad de una hipótesis a medida que se obtiene nueva evidencia. De este modo, se combina conocimiento previo con nueva información para conseguir una probabilidad posterior. En el análisis bayesiano, se modelan las incertezas como distribuciones de probabilidad, lo que permite incorporar incertidumbre en los parámetros y actualizar creencias de forma iterativa.

Esta metodología contrasta con el modelo frecuentista, el otro gran paradigma en estadística, ya que este se basaría solo en los datos de las pruebas y determina que los parámetros son fijos.

Por otro lado, el método bayesiano se diferencia de otros enfoques como los métodos no paramétricos o aquellos basados en aprendizaje automático, ya que estos no necesitan depender explícitamente de probabilidades como ocurre con las redes neuronales.

La metodología bayesiana se constituye como un pilar fundamental en el análisis estadístico moderno gracias a su capacidad para modelar la incertidumbre, integrar información previa y adaptarse a diversos contextos. Esta flexibilidad la convierte en una herramienta valiosa muy empleada en diversas disciplinas como las finanzas, la medicina, la Inteligencia Artificial (IA) y las ciencias sociales.

Novedad de la investigación

Cómo ha señalado el editor jefe de la revista ‘Bayesian Analysis’, la investigación elaborada por el grupo se ha posicionado como uno de los artículos más leídos de la publicación científica y ha sido seleccionada para su discusión pública con expertos, una distinción exclusiva para aquellos trabajos más relevantes.

Al final del artículo, los autores ilustran, a través de estudios de simulación, el funcionamiento de la propuesta para así poder compararla con algunas alternativas y muestran que su método iguala o mejora otros procedimientos existentes, especialmente cuando el porcentaje de datos faltantes es elevado o existe una fuerte correlación entre las variables consideradas.

Un método que resulta útil en todas las áreas en las que los datos estén incompletos (ya sea por errores, fallos en la recogida o pérdidas) y se requiera tomar decisiones sobre modelos estadísticos como, por ejemplo, en medicina, estudios sociales, economía o ciencias ambientales. Un tratamiento correcto de la incertidumbre, tanto del modelo como de los datos faltantes, mejora la fiabilidad de las inferencias y predicciones.

Los autores

Este trabajo ha sido realizado por Gonzalo García-Donato (Universidad de Castilla-La Mancha), María Eugenia Castellanos († 2025, Universidad Rey Juan Carlos), Stefano Cabras (Universidad Carlos III de Madrid), Alicia Quirós (Universidad de León) y Anabel Forte (Universitat de València) y financiado por el Ministerio de Ciencia, Innovación y Universidades y la Agencia Española de Investigación, a través de las ayudas a proyectos de Generación de Conocimiento. Los autores dedican «con cariño y admiración» el artículo a María Eugenia Castellanos, «cuya labor científica y calidad humana dejaron una profunda huella en el equipo».