\documentclass{article}


% if you need to pass options to natbib, use, e.g.:
%     \PassOptionsToPackage{numbers, compress}{natbib}
% before loading maeb_2025


% ready for submission
%\usepackage{maeb_2025}


% to compile a preprint version, e.g., for submission to arXiv, add add the
% [preprint] option:
%     \usepackage[preprint]{maeb_2025}


% to compile a camera-ready version, add the [final] option, e.g.:
\usepackage[final]{maeb_2025}


% to avoid loading the natbib package, add option nonatbib:
%    \usepackage[nonatbib]{maeb_2025}


\usepackage[utf8]{inputenc} % allow utf-8 input
\usepackage[T1]{fontenc}    % use 8-bit T1 fonts
\usepackage{hyperref}       % hyperlinks
\usepackage{url}            % simple URL typesetting
\usepackage{booktabs}       % professional-quality tables
\usepackage{amsfonts}       % blackboard math symbols
\usepackage{nicefrac}       % compact symbols for 1/2, etc.
\usepackage{microtype}      % microtypography
\usepackage{xcolor}         % colors

\usepackage{graphicx}

\title{Propuesta de Proyecto:  Modelado y calibración de transmisión del Virus Respiratorio Sincitial mediante Gramáticas evolutivas y arPSO }


% The \author macro works with any number of authors. There are two commands
% used to separate the names and addresses of multiple authors: \And and \AND.
%
% Using \And between authors leaves it to LaTeX to determine where to break the
% lines. Using \AND forces a line break at that point. So, if LaTeX puts 3 of 4
% authors names on the first line, and the last on the second line, try using
% \AND instead of \And before the third author name.


\author{%
 Daniel Parra\\
  Universidad Complutense de Madrid (UCM) \\
 %UCM \\
  \texttt{dparra02@ucm.es } \\
  \And
  Marcos Llamazares \\
   Universitat Politècnica de València (UPV) \\
  %UPV\\
  \texttt{marllalo@upvnet.upv.es } \\
  \And
  Jose Manuel Velasco \\
  UCM\\
  % Universidad Complutense de Madrid  \\
  \texttt{mvelascc@ucm.es } \\
  \And
  Rafael J. Villanueva \\
  % Universitat Politècnica de València  \\
  UPV \\
\texttt{rjvillan@imm.upv.es } \\
  \And
    Jose I. Hidalgo \\
  % Universidad Complutense de Madrid  \\
  UCM \\
\texttt{hidalgo@ucm.es } \\
}


\begin{document}


\maketitle


%\begin{abstract}

%\end{abstract}


\vspace{-0.9cm}
\section{Introducción}

% El Virus Respiratorio Sincitial (VRS) \cite{ANDERSON2013B209}, es una de las principales causas de infecciones de las vías respiratorias en niños en todo el mundo, provocando aproximadamente 3 millones de hospitalizaciones y unas 66,000 muertes de menores de cinco años anualmente. En el estudio del VRS se considera que existen al menos cuatro poblaciones objetivo a tener en cuenta, siendo estas: lactantes(<6 meses), niños >= 6 meses, mujeres embarazadas y ancianos. En este trabajo nos centraremos en los casos de niños menores de 1 año.



El Virus Respiratorio Sincitial (VRS) es una de las principales causas de infecciones de las vías respiratorias en niños en todo el mundo, provocando aproximadamente 3 millones de hospitalizaciones y unas 66,000 muertes de menores de cinco años anualmente \cite{ANDERSON2013B209}. Además, representa un problema de salud pública debido a su alta transmisibilidad y marcada estacionalidad \cite{Pitzer2015-mc}, lo que genera presión sobre los sistemas sanitarios, especialmente en temporadas de alta incidencia \cite{Li2022-aw}. Aunque actualmente existen estudios epidemiológicos y modelos matemáticos para predecir su propagación, la captura precisa de los picos de infección sigue siendo un desafío \cite{Weber2001-og}.

Estos modelos epidemiológicos suelen describir la propagación de enfermedades mediante sistemas de ecuaciones diferenciales que consideran diferentes estados de los individuos (susceptibles, infectados, recuperados, etc.) y parámetros que determinan las tasas de transmisión, recuperación y pérdida de inmunidad. Sin embargo, uno de los aspectos más difíciles de modelar es la variabilidad temporal de la tasa de contagio, que suele representarse con funciones periódicas como cosenos con fase y amplitud ajustables. Aunque estos enfoques han sido ampliamente utilizados, en la práctica, su capacidad para capturar los picos de infecciones observados en los datos empíricos es limitada. Algunos estudios han abordado esta limitación introduciendo múltiples términos sinusoidales o técnicas de inferencia bayesiana para ajustar la tasa de contagio. Sin embargo, estos enfoques incrementan la complejidad del modelo, requieren una mayor cantidad de parámetros a calibrar y, en muchos casos, no consideran adecuadamente la identificabilidad de los parámetros ni la incertidumbre de las estimaciones.

%En este proyecto, proponemos utilizar una técnica evolutiva híbrida basada en "Grammatical Evolution" (GE)\cite{neill_ryan2001}, una variante de la programación genética \cite{koza92}, para la determinación de las ecuaciones del modelo de contagio y que emplea atracction-repulsion Particle Swarm Optimization (arPSO)\cite{Riget2002}  para ajustar los parámetros del sistema.


Este proyecto tiene como objetivo desarrollar un modelo de transmisión del VRS en niños menores de un año, empleando un enfoque basado en Gramáticas Evolutivas (GE) \cite{neill_ryan2001}, una variante de la programación genética \cite{koza92}, para generar funciones de transmisión $\beta (t)$ que representen con mayor precisión la dinámica estacional del virus. Además, se utiliza la Optimización Adaptativa por Enjambre de Partículas con Compartición de Datos Asíncrona y Aleatoria (arPSO)\cite{Rada-Vilela2011} para calibrar los parámetros restantes del modelo epidemiológico, mejorando así la capacidad de predicción del sistema. Esperamos que la combinación de estos enfoques permita una exploración flexible del espacio de búsqueda, asegurando una mejor adaptación a los datos reales sin incrementar innecesariamente la complejidad del modelo.


\section{Modelo de transmisión}

% Dependiendo del estado en el que se encuentran los individuos y cómo interactúan, nuestro modelo describe la dinámica de transmisión del VRS mediante los siguientes estados:
% \begin{itemize}
%     \item \textbf{Sano o susceptible (S)}: Se puede contagiar por contacto con un individuo infeccioso (I) y pasar al estado de latente.
%     \item \textbf{Latente (L)}: Infectado pero no infeccioso, tras un período de tiempo siendo latente, pasa a infeccioso.
%     \item \textbf{Infeccioso (I)}: Es capaz de transmitir la enfermedad y dependiendo de su evolución puede pasar a estar recuperado o, si empeora, puede acabar hospitalizado.
%     \item \textbf{Hospitalizado (H)}: Tras un tiempo, deja de ser infeccioso y pasa a estar recuperado.
%     \item \textbf{Recuperado (R)}:Individuo que ha superado la infección y ha adquirido una inmunidad temporal tras la cual, vuelve a ser susceptible.
% \end{itemize}

Dependiendo del estado en el que se encuentran los individuos y cómo interactúan, nuestro modelo describe la dinámica de transmisión del VRS a través de distintos estados. En primer lugar, un individuo sano o susceptible (S) puede contagiarse por contacto con un individuo infeccioso (I), tras lo cual pasa al estado latente (L). En esta etapa, el individuo está infectado pero no transmite la enfermedad; con el tiempo, pasa a ser infeccioso. Un individuo infeccioso es capaz de transmitir la enfermedad y, dependiendo de su evolución, puede recuperarse (R) o, si empeora, puede acabar hospitalizado (H). En el caso de los hospitalizados, tras un periodo de tiempo, deja de ser infeccioso y pasa a estar recuperado. Los individuos recuperados que han superado la infección adquieren una inmunidad temporal y, una vez que esta desaparece, vuelven a ser susceptibles.

En la Figura \ref{fig:VRS_model} se muestra la transición de los individuos entre los distintos estados de manera gráfica.
\vspace{-0.4cm}
\begin{figure}[htb] 
    \centering  
    \includegraphics[width = 0.65\textwidth]{fig/VRS_model.png}
    \vspace{-0.5cm}
    \caption{Representación gráfica de la dinámica de transmisión del VRS.}
    \label{fig:VRS_model}   
\end{figure}



Los parámetros de latencia, hospitalización, recuperación e inmunidad son parámetros
constantes que se mueven en unos rangos dependiendo de los individuos.
Sin embargo, el contagio sigue un patrón estacional, como se puede ver en la Figura \ref{fig:holpitalizados}, donde se muestran los casos de niños menores de 1 año hospitalizados semanalmente entre 2011 y 2015.


\begin{figure}[htb] 
    \centering  
    \includegraphics[width = 0.70\textwidth]{fig/hospitalizados.png}
    \caption{niños menores de 1 año hospitalizados semanalmente entre 2011 y 2015.}
    \label{fig:holpitalizados}   
\end{figure}
La tasa de contagio del VRS se suele modelar mediante una función que involucra cosenos con fase y una amplitud ajustables que permite simular el término estacionar. Sin embargo , estos enfoques pueden no ser suficientes a la hora de capturar los picos de infecciones en los datos. Un enfoque común es el uso de la Ecuación \ref{eq:beta}:
%\vspace{-0.1cm}
\begin{equation}
\beta(t) = b_0 + b_1 \cos \left( \frac{2\pi t}{365} + \phi \right)
\label{eq:beta}
\end{equation}


donde $ b_0$ es la tasa de contagio base (baseline), $ b_1$ es la amplitud y $\phi$ la fase. Este tipo de términos no se han investigado mucho y el caso es que cuando se calibra el modelo, este término estacional no permite alcanzar los picos de infecciosos/hospitalizados, lo cual, desde el punto de Salud Pública y gestión de recursos, es un problema.

\section{Propuesta}


% Algunos autores emplean múltiples términos sinusoidales en la función $\beta (t)$ para mejorar la precisión en la representación de los picos de contagio. Sin embargo, este enfoque incrementa la cantidad de parámetros a ajustar, lo que complica la calibración del modelo, generalmente realizada dentro de un marco bayesiano (función de máxima verosimilitud). Este tipo de metodología, aunque efectiva en ciertos casos, suele omitir aspectos cruciales como la identificabilidad del modelo,es decir, garantizar que distintas combinaciones de parámetros no describan erróneamente la misma dinámica epidemiológica y la incertidumbre en las estimaciones, ya que comúnmente solo se reporta el valor medio sin proporcionar intervalos o bandas de confianza.

En este proyecto, proponemos el uso de Gramáticas Evolutivas (GE) para calibrar $\beta_i (t)$, permitiendo una mayor flexibilidad en la construcción de la función de transmisión. Aunque en principio sería posible ajustar también otros parámetros del modelo dentro del proceso de GE, consideramos que una estrategia más eficiente es optimizarlos mediante un algoritmo de Optimización por Enjambre de Partículas Adaptativa (asíncrono-random) (arPSO). Esta aproximación híbrida busca equilibrar la exploración del espacio de búsqueda y la eficiencia computacional en la calibración del modelo.


% Hay autores que usan varios términos en senos y cosenos para $\beta (t)$. De esta forma se acercan mejor a los picos, pero aumentando el número de parámetros a ajustar y calibrando el modelo mediante una función de máxima verosimilitud (enfoque bayesiano), donde no se preocupan de cuestiones como la identificabilidad del modelo (asegurarse de que los parámetros de distintas zonas del espacio de parámetros no describen la situación de estudio) ni de la incertidumbre, porque siempre muestran la media y nunca intervalos/bandas de confianza.

% En base a esta información, proponemos usar técnicas de Gramáticas Evolutivas (GE) para calibrar $\beta_i (t)$. Por otro lado, aunque quizás se pudieran calibrar también dentro del algoritmo de GE, el resto de parámetros se ajustarán mediante un arPSO, ya que realizar todos esos procedimientos dentro del ámbito de GE no parece que sea la forma más eficiente.
% Es por eso que vamos a proponer un procedimiento híbrido de la siguiente forma:

\begin{itemize}
    \item Llamaremos $M(\beta_i (t),\alpha_{best},t)$ el modelo de VRS que depende de la función de transmisión $\beta (t)$ y de una serie de parámetros que vamos a agrupar en el vector $\alpha$, y del tiempo $t$.
    \item Consideraremos una función de error $E(om,d)$, donde $om$ es la salida del modelo que se va a comparar con alguna medida con los datos $d$.
    \item Tendremos un algoritmo de optimización mediante gramáticas evolutivas que llamaremos GE con el objetivo de calibrar $\beta (t)$.
    \item Tendremos el algoritmo de optimización arPSO con el objetivo de calibrar los parámetros contenidos en el vector $\alpha$ .
\end{itemize}

Partiendo de esta base, a continuación describimos el procedimiento de ajuste empleando GE y arPSO:

\begin{figure}[htb] 
    \centering  
    \includegraphics[width = 1\textwidth]{fig/propuesta.png}
    \vspace{-0.5cm}
    \caption{Procedimiento de ajuste de parámetros y obtención de función de transmisión mediante GE y arPSO}
    \label{fig:propuesta}   
\end{figure}

\begin{enumerate}
    \item GE genera N funciones de transmisión $\beta_i (t)$ (individuos).
    \item Por cada función se ejecuta una instancia de arPSO con M partículas $\alpha_i$.
    \begin{enumerate}
        \item Evaluamos el modelo en cada una de las de partículas $om_i = M(\beta_i (t),\alpha_i,t)$, obteniendo el error de las partículas $e_i = E(om_i,d)$.
        \item Mediante el proceso de ajuste, se actualiza el mejor resultado y se trata de reducirlo en la medida de lo posible. 
        \item Al cumplir la condición de terminación de arPSO, se devuelve un modelo $om_{Best} = M(\beta_i (t),\alpha_{Best},t)$ y el error $e_{Best} = E(om_{Best},d)$ que servirá como error para la $\beta_i (t)$ de GE.
    \end{enumerate}
    \item Se genera la nueva población de GE mediante cruce y mutación, tomando como fitness el error obtenido por el arPSO para los diferentes individuos.
    \item Volvemos al paso 2 y repetimos hasta cumplir la condición de finalización de GE.

\end{enumerate}

Al finalizar el proceso descrito, representado en la Figura \ref{fig:propuesta}, obtendremos una función de transmisión $\beta(t)$ y su configuración óptima de parámetros con los que construimos el modelo $om$.
\section{Agradecimientos}
Marcos Llamazares López ha sido beneficiario de una beca de doctorado por parte del Programa de Ayudas de Investigación y Desarrollo (PAID), Universitat Politècnica de València (UPV).
Este trabajo ha contado con el apoyo del Ministerio de Innovación, Ciencia y Universidad de España (PID2021-125549OB-I00) y de los Fondos Next Generation de la UE (PDC2022-133429-I00).

\section{Requisitos}
% Para llevar a cabo este proyecto, es necesario:
% \begin{itemize}
%     \item \textbf{Implementación}: Se debe desarrollar un entorno de simulación que integre GE y arPSO 
%     \item \textbf{Validación del método}: Comprobar si la combinación de estas técnicas proporciona soluciones útiles.
%     \item \textbf{Desarrollo de una gramática adecuada}: Es necesario identificar aquellos elementos que aporten valor en la gramática, constantes, cosenos, exponenciales, etc.
%     \item \textbf{Estudio del espacio de búsqueda}: Asegurarse que esta configuración modular no interfiera en la búsqueda apropiada en ambos algoritmos de optimización.
%     \item \textbf{Convergencia}: Estudiar la convergencia de ambos procesos.
% \end{itemize}


Para la ejecución del proyecto, se requieren los siguientes elementos clave:
\begin{itemize}
    \item \textbf{Desarrollo del entorno de simulación}: Es fundamental implementar una plataforma que integre Gramáticas Evolutivas (GE) y Optimización por Enjambre de Partículas Adaptativa (arPSO), permitiendo la calibración eficiente del modelo epidemiológico. 
    \item \textbf{Validación del enfoque propuesto}:  Se debe evaluar si la combinación de GE y arPSO produce soluciones precisas y útiles en la estimación de la función de transmisión $\beta(t)$ y los parámetros del modelo.
    \item \textbf{Desarrollo de una gramática adecuada}: Es crucial definir una gramática que permita generar expresiones funcionales relevantes, incorporando operadores matemáticos como constantes, términos trigonométricos (senos y cosenos) y exponenciales, asegurando la capacidad de representar patrones epidemiológicos complejos.
    \item \textbf{Análisis del espacio de búsqueda}: Se debe garantizar que la estructura modular del modelo no introduzca restricciones que perjudiquen la exploración y optimización conjunta de los parámetros y la función de transmisión.
    \item \textbf{Estudio de la convergencia}: Es necesario analizar la estabilidad y eficiencia conjunta de ambos algoritmos, verificando que converjan hacia soluciones óptimas en un tiempo computacional razonable.
\end{itemize}


% \section*{References}


% References follow the acknowledgments in the camera-ready paper. Use unnumbered first-level heading for
% the references. Any choice of citation style is acceptable as long as you are
% consistent. It is permissible to reduce the font size to \verb+small+ (9 point)
% when listing the references.
% Note that the Reference section does not count towards the page limit.
\medskip
\bibliographystyle{unsrt} %para trabajar en la bibligrafia. Luego cambiar
\bibliography{biblio}
\end{document}