Catálogo Actividad Investigación

Probabilidad y estadística matemática
  • Sector biomédico

  • Sector eléctrico

  • Sector energético

  • ...

Las actividades del grupo se enmarcan dentro de la investigación en Teoría de la Probabilidad y Estadística Matemática de carácter básico. La filosofía que inspira el trabajo del grupo tiene su punto de partida en el análisis de conceptos básicos de la Estadística desde distintas ópticas (ideas geométricas de representación y aproximación, métricas probabilísticas, robustez o estabilidad de los procedimientos, etc.) con el ánimo de desarrollar nuevos métodos estadísticos y estudiar su implementación práctica y sus propiedades en comparación con procedimientos ya existentes. Desde esta perspectiva, las líneas prioritarias se pueden clasificar como:

  • Métodos estadísticos robustos. Técnicas de recorte y aplicaciones estadísticas.

  • Estudio de métricas probabilísticas y de sus aplicaciones estadísticas.

  • Transporte óptimo y sus aplicaciones estadísticas.

  • Métodos basados en remuestreo. Técnicas bootstrap.

  • Análisis de datos funcionales.


Actualmente, entre los procedimientos que el grupo está diseñando o analizando, destacan los relacionados con:

- Análisis cluster y modelos de mezcla.

El análisis cluster o análisis de conglomerados incluye una serie de métodos estadísticos diseñados para encontrar grupos con cierto grado de homogeneidad dentro de una población o conjunto de datos. Por su parte, los modelos de mezcla se utilizan para explicar conjuntos de datos con varias procedencias. En ambas situaciones, tanto los grupos como las diversas procedencias pueden a veces explicarse en términos de alguna variable desconocida a priori, por lo que los procedimientos de análisis diseñados en estos ámbitos se vinculan de forma natural a la clasificación o a la minería de datos, que constituyen herramientas esenciales en todo tipo de investigaciones.

Desde la perspectiva de la Estadística Robusta, los procedimientos deben diseñarse contando con la frecuente aparición de contaminaciones en los datos, bien sea porque las herramientas con los que se obtuvieron generan algún tipo de errores, o porque existen individuos atípicos dentro de la población, que no llegan a constituir un grupo. El diseño de métodos a través de procedimientos de recorte, eliminando de forma objetiva una proporción de los datos obtenidos, permite en estos modelos obtener clasificaciones y agrupaciones robustas, computacionalmente factibles y libres de los efectos que se derivarían de la presencia de contaminaciones.


- Validación esencial de modelos y análisis de similitud.

Los modelos estadísticos son aproximaciones ideales capaces de explicar determinadas pautas de comportamiento esperables en los resultados obtenidos por repeticiones de un experimento. La validación de un modelo intenta garantizar, con cierto nivel de confianza, que el modelo elegido refleja adecuadamente el comportamiento esperable del experimento. Análogamente, la homogeneidad entre dos conjuntos de datos se plantea inicialmente como el reconocimiento, medido a través de algún nivel de confianza, de que ambos conjuntos se han obtenido como resultado de experimentos equivalentes. En otras palabras, las pautas de comportamiento de tipo estadístico de ambos conjuntos son las mismas. 

La validación esencial o la similitud, a un nivel dado, incluyen la posibilidad de “descontar” alguna parte de los datos al buscar la homogeneidad o la adecuación al modelo y suponen un valor añadido en estos problemas, al incluir explicitamente el hecho de que los modelos son meras aproximaciones que pueden graduarse.


- Problema de transporte incompleto.

Las matemáticas que permiten proponer soluciones a los problemas que aborda el grupo están muy vinculadas a determinadas herramientas de carácter general, cuya puesta a punto es frecuentemente un difícil reto. Las técnicas de remuestreo constituyen en su conjunto un poderosísimo elemento para la validación de una hipótesis estadística o simplemente para intuir el comportamiento esperable de un procedimiento en presencia de aleatoriedad. Las métricas probabilísticas están íntimamente vinculadas al desarrollo de la Estadística, al estar diseñadas especificamente para medir el grado de adecuación de los datos a los modelos, pero también han servido de inspiración para la propuesta de nuevos procedimientos.

El caso de la métrica de Wasserstein es ciertamente singular. Su irrupción en diversas áreas de las Matemáticas ha sido paulatino, pero su repercusión en cada una de ellas es notable. Buena prueba de ello es la gama de nombres célebres en las Matemáticas vinculados a problemas que pueden describirse en términos de esta distancia. En particular el problema del transporte óptimo de bienes constituye un foco de atención permanente en la comunidad matemática. El grupo de investigación ha obtenido resultados importantes en esta línea, que ahora se ha reabierto con el problema del transporte incompleto, en el que una pequeña parte de los bienes no necesariamente deben ser transportados. Varios de los resultados fundamentales en sus estudios sobre la similitud de muestras son consecuencia de este peculiar enfoque, pero su trascendencia y la variedad de nuevos problemas que sugiere sobrepasan ampliamente los planteamientos iniciales del GIR.

Aunque las líneas de trabajo del equipo tienen una fuerte componente matemática, los principios en los que descansan tienen una clara vocación de aplicabilidad. Ello explica la participación del grupo en diversos proyectos de investigación aplicada, en colaboración con empresas o instituciones.

El grupo, ampliado con miembros del GIR Grupo de Ingeniería Biomédica también de la Universidad de Valladolid, está reconocido como Grupo de Investigación de Excelencia de la Junta de Castilla y León (GR-150).

  • ‘Técnicas de Remuestreo, de Recorte y Métricas Probabilísticas. Aplicaciones Estadísticas’ (2012-2014), proyecto financiado por el Ministerio de Ciencia e Innovación. IP: Carlos Matrán Bea

  • ‘Técnicas de Remuestreo, de Recorte y Métricas Probabilísticas. Aplicaciones Estadísticas’ (2009-2011), proyecto financiado por el Ministerio de Ciencia e Innovación. IP: Carlos Matrán Bea

  • ‘Técnicas de Remuestreo, de Recorte y Métricas Probabilísticas. Aplicaciones Estadísticas y de la Ingeniería Biomédica’ (2008-2010), proyecto financiado en la convocatoria de Grupos de Investigación de Excelencia de Castilla y León. IP: Carlos Matrán Bea

  • 'Desarrollo de un proyecto de Generación de Algoritmos de Clasificación de muestras biológicas' (2006-2007), contrato financiado por Tecnorail Consulting S.L. para PROTEOMIKA. IP: Carlos Matrán Bea

  • 'Colaboración en el proyecto Closser para la detección de pérdidas no técnicas en el sector eléctrico' (2014), contrato financiado por Atos WorldGrid, S.L.. IP: Pedro C. Álvarez Esteban y Juan A. Cuesta-Albertos

  • 'Segunda fase del proyecto de colaboración en el desarrollo de una nueva prueba de laboratorio para el diagnóstico in vitro de la enfermedad de Alzheimer' (2011-2012), contrato financiado por Biocross, S.L.. IP: Miguel A. Fernández Temprano

  • 'Asesoría para la implementación de un modulo informático que permita la estimación de consumos energéticos' (2012), contrato financiado por Smarkia, S.L.. IP: Pedro C. Álvarez Esteban

  • 'Caracterización y modelización del comportamiento de activos para la obtención de modelos de evaluación del riesgo en el proyecto ENERGOS' (2009-2012), contrato financiado por DiagnóstiQA Consultoría Técnica S.L.. y CDTI (Ministerio de Ciencia e Innovación). IP: Pedro C. Álvarez Esteban

  • 'Colaboración en el desarrollo de una nueva prueba de laboratorio para el diagnóstico in Vitro de la enfermedad de Alzheimer' (2011), contrato financiado por Biocross, S.L.. IP: Miguel A. Fernández Temprano


  • Publicaciones

    - ‘Avoiding spurious local maximizers in mixture modeling’ (L.A. García Escudero, A. Gordaliza, C. Matrán, A. Mayo), en Statistics and Computing, 2014

    - ‘Robust constrained fuzzy clustering’ (H. Fritz, L.A. García-Escudero, A. Mayo-Iscar), en Information Sciences, 2013

    - ‘Searching for a common pooling pattern’ (P.C. Álvarez-Esteban, E. del Barrio, J.A. Cuesta-Albertos, C. Matrán), en Computational Statistics & Data Analysis, 2013

    - ‘The empirical cost of optimal incomplete transportation’ (E. del Barrio, C. Matrán), en Annals of Probability, 2013

    - ‘Similarity of Samples and Trimming’ (P.C. Álvarez-Esteban, E. del Barrio, J.A. Cuesta-Albertos, C. Matrán), en Bernoulli, 2012

    - ‘tclust: An R package for a trimming approach to Cluster Analysis’ (H. Fritz, L.A. García-Escudero, A. Mayo-Iscar), en Journal of Statistical Software, 2012

    - ‘Robust Condition Monitoring for early detection of broken rotor bars in induction motors’ (L.A. García-Escudero, O. Duque-Pérez, D. Morinigo-Sotelo, M. Pérez-Alonso), en Expert Systems with Applications, 2011

    - ‘Uniqueness and Approximate Computation of Optimal Incomplete Transportation Plans’ (P.C. Álvarez-Esteban, E. del Barrio, J.A. Cuesta-Albertos, C. Matrán), en Annales de l’ Institut Henri Poincaré. Probability and Statistics, 2011

    - ‘Robust Clusterwise linear regresión through trimming’ (L.A. García-Escudero, A. Gordaliza, R. San Martín, A. Mayo-Iscar), en Computational Statistics and Data Analysis, 2010

    - ‘A review of robust clustering methods’ (L.A. García-Escudero, A. Gordaliza, C. Matrán, A. Mayo-Iscar), en Advances in Data Analysis and Classification, 2010

    - ‘A general trimming approach to robust cluster análisis’ (L.A. García Escudero, A. Gordaliza, C. Matrán, A. Mayo), en Annals of Statistics, 2008

    - ‘Robust estimation in the normal mixture model based on robust clustering’ (J.A. Cuesta-Albertos, C. Matrán, A. Mayo), en Journal of the Royal Statistical Society Series B, 2008

    - ‘Trimmed Comparison of Distributions. Journal of the American Statistical Association, Theory and Methods’ (P.C. Álvarez-Esteban, E. del Barrio, J.A. Cuesta-Albertos, C. Matrán), en Journal of the American Statistical Association, 2008

    - ‘Generalized Radius Processes for Elliptically Contoured Distributions’ (L.A. García-Escudero, A. Gordaliza), en Journal of the American Statistical Association, 2005


  • Prof. Ortega, CIMAT, Centro de Investigación en Matemáticas (México)

  • Prof. Janssen, Universität Düsseldorf (Alemania)

  • Prof. Fitzmoser, Vienna University of Technology (Austria)

  • Prof. Croux, K U Leuven, y Haesbroeck, Université de Liège (Bélgica)

  • Profs. Gamboa y Loubes, Université Paul Sabatier (Francia)

  • Profs. Riani y Cerioli, Università degli Studi di Parma; Ingrassia, Università degli Studi di Catania, Gresselin Università degli Studi di Milano-Bicocca, y Farcomeni, Sapienza-Università di Roma (Italia)

  • Prof. Hennig, University College London, y Battey, Imperial College (Reino Unido)

  • Prof. Cuesta Albertos, Universidad de Cantabria