\documentclass{article}

% if you need to pass options to natbib, use, e.g.:
% \PassOptionsToPackage{numbers, square}{natbib}
% before loading maeb_2025

% ready for submission
%\usepackage{maeb_2025}


% to compile a preprint version, e.g., for submission to arXiv, add add the
% [preprint] option:
%     \usepackage[preprint]{maeb_2025}


% to compile a camera-ready version, add the [final] option, e.g.:
%     \usepackage[final]{maeb_2025}


% to avoid loading the natbib package, add option nonatbib:
\usepackage[nonatbib,final]{maeb_2025}


\usepackage[utf8]{inputenc} % allow utf-8 input
\usepackage[T1]{fontenc}    % use 8-bit T1 fonts
\usepackage{hyperref}       % hyperlinks
\usepackage{url}            % simple URL typesetting
\usepackage{booktabs}       % professional-quality tables
\usepackage{amsfonts}       % blackboard math symbols
\usepackage{nicefrac}       % compact symbols for 1/2, etc.
\usepackage{microtype}      % microtypography
\usepackage{xcolor}         % colors

\usepackage{comment}

% Used for displaying tables.
\usepackage[separate-uncertainty=true, group-digits=integer]{siunitx}
\usepackage{booktabs,makecell,multirow}
\sisetup{group-minimum-digits=4}
\sisetup{detect-weight,mode=text}
\renewrobustcmd{\boldmath}{}

\usepackage{dsfont}
\usepackage{amsmath}

\usepackage{algorithm}
\usepackage{algpseudocode}
\renewcommand{\algorithmicrequire}{\textbf{Requiere:}}
\renewcommand{\algorithmicensure}{\textbf{Asegura:}}
\renewcommand{\thealgorithm}{\arabic{algorithm}}  
\floatname{algorithm}{Algoritmo}    

\renewcommand{\refname}{Referencias}
\renewcommand{\figurename}{Figura}
\renewcommand{\tablename}{Tabla}

% tikz for figures
\usepackage{tikz}
\usetikzlibrary{arrows,shapes,automata,backgrounds,petri,chains}
\usetikzlibrary{matrix,decorations.pathreplacing,calc,positioning,fit,trees}

% Colors for the figures
\definecolor{graph1}{HTML}{05C090}
%\definecolor{graph2}{HTML}{118AB2} % Blue
\definecolor{graph2}{HTML}{B30033} % Red

\newcommand{\tcr}[1]{\textcolor{red}{#1}}

\usepackage[caption=false, font=footnotesize]{subfig}


\newrobustcmd{\B}{\fontseries{b}\selectfont}
\newtheorem{definition}{Definición}


\def\SMHD{\textsc{SMHD$_\mathbb{G}$}}
\def\FSim{\textsc{FSim$_\mathbb{G}$}}
\def\Ea{$\mathcal{E}_{\mathcal{G}^+}$}
\def\Eb{$\mathcal{E}_{\mathbb{G}}$}
\def\Ec{$\mathcal{E}_{\mathbb{G}}^*$}






\title{Algoritmos Genéticos para la Fusión Eficiente de Redes Bayesianas mediante Eliminación de Enlaces Previa a la Fusión}


% The \author macro works with any number of authors. There are two commands
% used to separate the names and addresses of multiple authors: \And and \AND.
%
% Using \And between authors leaves it to LaTeX to determine where to break the
% lines. Using \AND forces a line break at that point. So, if LaTeX puts 3 of 4
% authors names on the first line, and the last on the second line, try using
% \AND instead of \And before the third author name.


\author{%
  Pablo Torrijos\\
  Departamento de Sistemas Informáticos\\
  %Instituto de Investigación en Informática de Albacete (I3A)\\
  Universidad de Castilla-La Mancha\\
  Albacete, España \\
  \texttt{Pablo.Torrijos@uclm.es} \\
\And
  José A. Gámez\\
  Departamento de Sistemas Informáticos\\
  Universidad de Castilla-La Mancha\\
  Albacete, España \\
  \texttt{Jose.Gamez@uclm.es} \\
\And
  José M. Puerta\\
  Departamento de Sistemas Informáticos\\
  Universidad de Castilla-La Mancha\\
  Albacete, España \\
  \texttt{Jose.Puerta@uclm.es} \\
\And
  Juan Á. Aledo\\
  Departamento de Matemáticas\\
  Universidad de Castilla-La Mancha\\
  Albacete, España \\
  \texttt{JuanAngel.Aledo@uclm.es} \\
}

\begin{document}


\maketitle

% extensión máxima de 10 páginas

\begin{abstract}
  La fusión de Redes Bayesianas (RBs) combina redes de entrada en una sola estructura, equilibrando la conservación de dependencias con la viabilidad computacional. Mientras que una fusión sin restricciones mantiene todas las dependencias, tiende a generar redes excesivamente complejas con un alto \textit{treewidth}, lo que afecta a la escalabilidad de la inferencia. La fusión limitada mitiga este problema al eliminar enlaces para controlar el \textit{treewidth}, aunque puede sobreajustarse al ruido de las redes de entrada y omitir dependencias importantes en las RBs originales. Este artículo presenta un marco de consenso que prioriza las estructuras compartidas entre las redes de entrada mientras impone restricciones al \textit{treewidth}, asegurando un buen consenso. Introducimos algoritmos genéticos con inicialización avanzada, operadores especializados y una función de \textit{fitness} adaptada. Además, adaptamos métodos existentes a este problema e implementamos algoritmos voraces para su evaluación comparativa. Los experimentos realizados con RBs sintéticas y reales demuestran la superioridad de los algoritmos genéticos propuestos frente a los métodos adaptados y los voraces usados como base. 
\end{abstract}

%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%
%                        Introducción
%
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
\section{Introducción} \label{sec:introduction}

Las Redes Bayesianas (RBs) \cite{Jensen_Nielsen,Koller_Friedman} son modelos gráficos probabilísticos que representan dependencias complejas entre variables mediante Grafos Dirigidos Acíclicos (\textit{DAGs}, del inglés \textit{Directed Acyclic Graph}), combinando una estructura gráfica que codifica dependencias condicionales con distribuciones de probabilidad que cuantifican estas dependencias. Son interpretables gracias a su estructura gráfica y permiten inferencia simbólica \cite{Jensen_Nielsen}, lo que las hace útiles en áreas como bioinformática \cite{Angelopoulos_2022}, salud \cite{McLachlan2020} o modelado ambiental \cite{Dai2024}, donde permiten tomar decisiones bajo incertidumbre. Además, su capacidad para representar relaciones causales y facilitar la interpretación de resultados resalta su importancia en el ámbito de la Inteligencia Artificial (IA) explicable  \cite{Bacardit_GA_XAI_2022}.

El aprendizaje de RBs a partir de datos, aunque NP-duro \cite{learning-BN-NP_2004}, ha sido ampliamente investigado \cite{tsamardinos_max-min_2006,Larranaga_review_2013}. La fusión estructural de RBs \cite{pena_finding_2011,Puerta2021Fusion} es fundamental para combinar redes provenientes de diversos expertos o fuentes de datos. Esto resulta especialmente relevante en el aprendizaje distribuido y federado, donde  fusionar RBs es esencial para agregar modelos locales, como se muestra en trabajos recientes \cite{Laborda2024_KBS,Torrijos2024_DS}. Lograr una fusión óptima implica construir un modelo que capture todas las dependencias condicionales de las redes de entrada. Sin embargo, la fusión estándar de RBs genera grafos densos y complejos, limitando su uso en escenarios que requieren inferencia eficiente e interpretabilidad. Aunque este problema es NP-duro \cite{pena_finding_2011}, \cite{Puerta2021Fusion} propuso un enfoque heurístico para aproximar la RB fusionada óptima.

La complejidad de la inferencia en una RB depende de su \textit{treewidth} $t$, que se define como el tamaño del subconjunto más grande de nodos completamente conectados en una versión triangulada del grafo moral de la red\footnote{El grafo moral de una RB es el grafo no dirigido obtenido al vincular todos los pares de nodos no adyacentes con un hijo común y luego eliminar las direcciones de las enlaces.}. A medida que $t$ aumenta, la complejidad crece exponencialmente, $O(n \cdot k^{t+1})$ \cite{Chandrasekaran2008}, donde $n$ es el número de variables y $k$ el número de estados por variable, lo que hace que las RBs con alto \textit{treewidth} sean inviables para su uso práctico. Para mitigar esto, \cite{Torrijos2024_CEC} propuso un algoritmo genético que elimina enlaces en la red fusionada, reduciendo su \textit{treewidth} mientras conserva la estructura esencial de la fusión sin restricciones.

La computación evolutiva se ha utilizado históricamente como solución heurística en diversos problemas relacionados con las RBs \cite{Larranaga_review_2013}. En este trabajo, proponemos una metodología de fusión para lograr el \textit{treewidth} deseado en la RB de consenso mediante la eliminación selectiva de enlaces en las RBs originales antes de la fusión, utilizando un algoritmo genético con operadores ajustados al problema. Diseñamos dos enfoques: uno donde cada aparición de un enlace se trata como un elemento único en el cromosoma y otro donde los enlaces idénticos se tratan como un solo elemento. Para cada estrategia, se desarrolla un algoritmo voraz como base para la comparación de rendimiento.



Nuestra propuesta difiere de \cite{Torrijos2024_CEC} al redefinir la métrica de calidad de la solución. Mientras que la fusión en \cite{Puerta2021Fusion} captura todas las independencias condicionales, en algunos casos no es deseable preservar completamente esta fidelidad, especialmente en escenarios como el aprendizaje federado, donde independencias erróneas o adversariales pueden corromper la RB fusionada. Así, minimizamos la divergencia entre la RB fusionada y las de entrada, mejorando la robustez frente a (in)dependencias inexactas o maliciosas.

Las principales contribuciones de este trabajo son: 
\begin{itemize} 
    \item Establecer una nueva definición de consenso para la fusión de RBs que minimiza la divergencia promedio entre la RB fusionada y las de entrada mientras cumple con un \textit{treewidth}.
    \item Proponer un algoritmo genético y uno voraz con dos codificaciones diferentes para lograr el consenso de RBs mediante la eliminación selectiva de enlaces en las RBs de entrada. 
    \item Introducir nuevas métricas para evaluar la calidad de las RBs fusionadas, enfocándose en la divergencia respecto a las redes de entrada. 
    \item Proveer el código para permitir la reproducibilidad y fomentar la investigación en el campo. 
\end{itemize}

El resto del artículo está estructurado de la siguiente manera: la Sección \ref{sec:preliminaries} presenta una visión general de las RBs y conceptos clave. La Sección \ref{sec:problem_definition} formaliza el problema de consenso y sus restricciones. La Sección \ref{sec:algorithm} describe los algoritmos genéticos y voraces propuestos para lograr el consenso bajo una restricción de \textit{treewidth}. La Sección \ref{sec:experimental_evaluation} muestra los resultados de experimentos con datos sintéticos y reales. Finalmente, la Sección \ref{sec:conclusion} resume los hallazgos y señala futuras líneas de investigación.
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%
%                                PRELIMINARIES
%
% - Bayesian Networks 
% - Structural Fusion of Bayesian Networks
% - Inference
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
\section{Preliminares} \label{sec:preliminaries}

%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
\subsection{Redes Bayesianas} \label{subsec:preliminaries_bns}
Una Red Bayesiana (RB) \cite{Jensen_Nielsen,Koller_Friedman} es un modelo gráfico probabilístico que representa las dependencias (e independencias) condicionales entre un conjunto de variables ${\mathcal{X}} = \{X_1, \dots, X_n\}$. Formalmente, una RB se define como un par $\mathcal{B} = (\mathcal{G}, \mathcal{P})$, donde $\mathcal{G} = (\mathcal{X},\mathcal{E})$ es un Grafo Acíclico Dirigido (DAG) cuyos nodos ${\mathcal{X}}$ representan las variables y los bordes dirigidos $\mathcal{E}$ codifican las dependencias entre estas variables, y $\mathcal{P}$ es un conjunto de distribuciones de probabilidad condicionales, ${\mathbb{P}(X_i \mid pa(X_i))}_{i=1}^n$, donde $pa(X_i)$ denota el conjunto de padres de $X_i$ en $\mathcal{G}$.

La estructura $\mathcal{G}$ codifica las independencias condicionales utilizando el criterio de \textit{d-separación} \cite{Koller_Friedman}, lo que permite la factorización de la distribución de probabilidad conjunta $\mathbb{P}(X_1, \dots, X_n)$ como $\mathbb{P}(X_1, \dots, X_n) = \prod_{i=1}^n \mathbb{P}(X_i \mid pa(X_i))$. Así, $\mathcal{G}$ impone que cada variable $X_i$ es condicionalmente independiente de sus no-descendientes dado sus padres $pa(X_i)$ en el DAG.

Las independencias codificadas por $\mathcal{G}$ se representan como $I(\mathcal{G})$, donde cada elemento corresponde a una relación de independencia condicional de la forma $(X_i \perp X_j \mid Z)$, con $X_i$ y $X_j$ siendo condicionalmente independientes dado un subconjunto de nodos $Z$. Un DAG $\mathcal{G}_1$ es un \textit{I-map} (Mapa de Independencias) de otro DAG $\mathcal{G}_2$ si $I(\mathcal{G}_1) \subseteq I(\mathcal{G}_2)$, es decir, si $\mathcal{G}_1$ codifica al menos las mismas independencias que $\mathcal{G}_2$. Un DAG $\mathcal{G}_1$ es un \textit{I-map mínimo} de $\mathcal{G}_2$ si no se puede eliminar ningún arco de $\mathcal{G}_1$ sin violar al menos una independencia condicional en $\mathcal{G}_2$. Así, un \textit{I-map mínimo} $\mathcal{G}_1$ es el grafo más reducido que retiene todas las independencias condicionales de $\mathcal{G}_2$.


%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
\subsection{Fusión estructural de RBs} \label{subsec:fusion_bns}
La fusión estructural de Redes Bayesianas combina varias RBs, provenientes de diferentes fuentes o expertos, en una sola RB que capture las dependencias esenciales. Sea $\mathbb{B} = \{\mathcal{B}_1, \dots, \mathcal{B}_r\}$ un conjunto de RBs con los DAGs correspondientes $\mathbb{G} = \{\mathcal{G}_1, \dots, \mathcal{G}_r\}$. El objetivo es construir un DAG $\mathcal{G}^+$ que sea un \textit{I-map} mínimo de la intersección de los conjuntos de independencia, es decir, $I(\mathcal{G}^+) = \bigcap_{i=1}^{r} I(\mathcal{G}_i)$, minimizando el número de arcos y capturando las independencias comunes.

Por ejemplo, con las tres RBs representadas por los DAGs en la Fig. \ref{fig:ex1-original-RBs}, el objetivo es obtener un DAG $\mathcal{G}^+$ que mantenga solo las independencias condicionales comunes, reduciendo el número de arcos. La Fig. \ref{fig:ex3-fusion-RBs} ilustra dos posibles fusiones, donde la estructura de la izquierda es óptima.
%
%
\begin{figure}[htbp]
  \centering
  \begin{minipage}{0.44\textwidth}
        \centering
              \begin{tikzpicture}[->,>=stealth',shorten >=1pt,auto,node distance=0.95cm,  % DAG 1
                          semithick]
                    \tikzstyle{every state}=[fill=none,draw=black,text=black]
                  
                    \node[state,inner sep=0.5pt,minimum size=0.5pt]         (X1)                      {$X_1$};
                    \node[state,inner sep=0.5pt,minimum size=0.5pt]         (X2) [below of=X1]          {$X_2$};
                    \node[state,inner sep=0.5pt,minimum size=0.5pt]         (X3) [right of=X2]         {$X_3$};
                    \node[state,inner sep=0.5pt,minimum size=0.5pt]         (X4) [above of=X3]          {$X_4$};
                    
                    \path (X1) edge [graph2]             node {} (X2)
                          (X2) edge [graph2]             node {} (X3)
                          (X4) edge [graph2]             node {} (X3);
                  \end{tikzpicture}
          \hspace{0.5cm}
              \begin{tikzpicture}[->,>=stealth',shorten >=1pt,auto,node distance=0.95cm,  % DAG 2
                          semithick]
                    \tikzstyle{every state}=[fill=none,draw=black,text=black]
                  
                    \node[state,inner sep=0.5pt,minimum size=0.5pt]         (X1)                      {$X_1$};
                    \node[state,inner sep=0.5pt,minimum size=0.5pt]         (X2) [below of=X1]          {$X_2$};
                    \node[state,inner sep=0.5pt,minimum size=0.5pt]         (X3) [right of=X2]         {$X_3$};
                    \node[state,inner sep=0.5pt,minimum size=0.5pt]         (X4) [above of=X3]          {$X_4$};
                    
                    \path (X1) edge [graph2]             node {} (X4)
                          (X2) edge [graph2]             node {} (X3)
                          (X4) edge [graph2]             node {} (X3);
                  \end{tikzpicture}
          \hspace{0.5cm}
              \begin{tikzpicture}[->,>=stealth',shorten >=1pt,auto,node distance=0.95cm,  % DAG 3
                          semithick]
                    \tikzstyle{every state}=[fill=none,draw=black,text=black]
                  
                    \node[state,inner sep=0.5pt,minimum size=0.5pt]         (X1)                      {$X_1$};
                    \node[state,inner sep=0.5pt,minimum size=0.5pt]         (X2) [below of=X1]          {$X_2$};
                    \node[state,inner sep=0.5pt,minimum size=0.5pt]         (X3) [right of=X2]         {$X_3$};
                    \node[state,inner sep=0.5pt,minimum size=0.5pt]         (X4) [above of=X3]          {$X_4$};
                    
                    \path (X1) edge [graph2]             node {} (X4)
                          (X1) edge [graph2]             node {} (X3)
                          (X3) edge [graph2]             node {} (X2);
                  \end{tikzpicture}
      \caption{$\mathcal{G}_1 = \mathcal{G}_1^{\sigma^*};\ \mathcal{G}_2 = \mathcal{G}_2^{\sigma^*};\ \mathcal{G}_3$.}
      \label{fig:ex1-original-RBs}
  \end{minipage}%
  \begin{minipage}{0.2\textwidth}
        \centering
            \begin{tikzpicture}[->,>=stealth',shorten >=1pt,auto,node distance=0.95cm,  % DAG 2
                      semithick]
                \tikzstyle{every state}=[fill=none,draw=black,text=black]
              
                \node[state,inner sep=0.5pt,minimum size=0.5pt]         (X1)                      {$X_1$};
                \node[state,inner sep=0.5pt,minimum size=0.5pt]         (X2) [below of=X1]          {$X_2$};
                \node[state,inner sep=0.5pt,minimum size=0.5pt]         (X3) [right of=X2]         {$X_3$};
                \node[state,inner sep=0.5pt,minimum size=0.5pt]         (X4) [above of=X3]          {$X_4$};
                
                \path (X1) edge [graph2]             node {} (X2)
                      (X1) edge [graph2]             node {} (X3)
                      (X1) edge [graph2]             node {} (X4)
                      (X2) edge [graph2]             node {} (X3);
            \end{tikzpicture}
      \caption{$\mathcal{G}_3^{\sigma^*}$.}
      \label{fig:ex2-transformed-RBs}
  \end{minipage}%
  \begin{minipage}{0.35\textwidth}
      \centering
              \begin{tikzpicture}[->,>=stealth',shorten >=1pt,auto,node distance=0.95cm,  % DAG 1
                          semithick]
                    \tikzstyle{every state}=[fill=none,draw=black,text=black]
                  
                    \node[state,inner sep=0.5pt,minimum size=0.5pt]         (X1)                      {$X_1$};
                    \node[state,inner sep=0.5pt,minimum size=0.5pt]         (X2) [below of=X1]          {$X_2$};
                    \node[state,inner sep=0.5pt,minimum size=0.5pt]         (X3) [right of=X2]         {$X_3$};
                    \node[state,inner sep=0.5pt,minimum size=0.5pt]         (X4) [above of=X3]          {$X_4$};
                    
                    \path (X1) edge [graph2]             node {} (X2)
                          (X1) edge [graph2]             node {} (X3)
                          (X1) edge [graph2]             node {} (X4)
                          (X2) edge [graph2]             node {} (X3)
                          (X4) edge [graph2]             node {} (X3);
                  \end{tikzpicture}
          \hspace{1cm}
              \begin{tikzpicture}[->,>=stealth',shorten >=1pt,auto,node distance=0.95cm,  % DAG 2
                          semithick]
                    \tikzstyle{every state}=[fill=none,draw=black,text=black]
                  
                    \node[state,inner sep=0.5pt,minimum size=0.5pt]         (X1)                      {$X_1$};
                    \node[state,inner sep=0.5pt,minimum size=0.5pt]         (X2) [below of=X1]          {$X_2$};
                    \node[state,inner sep=0.5pt,minimum size=0.5pt]         (X3) [right of=X2]         {$X_3$};
                    \node[state,inner sep=0.5pt,minimum size=0.5pt]         (X4) [above of=X3]          {$X_4$};
                    
                    \path (X2) edge [graph2]             node {} (X1)
                          (X3) edge [graph2]             node {} (X1)
                          (X4) edge [graph2]             node {} (X1)
                          (X2) edge [graph2]             node {} (X3)
                          (X2) edge [graph2]             node {} (X4)
                          (X4) edge [graph2]             node {} (X3);
                  \end{tikzpicture}
      \caption{$\mathcal{G}^{+^{\sigma^*}};\ \mathcal{G}^{+^{(X_2, X_4, X_3, X_1)}}$.}
      \label{fig:ex3-fusion-RBs}
  \end{minipage}
\end{figure}
%
La construcción de ${\mathcal{G}}^+$ se realiza mediante los siguientes pasos \cite{pena_finding_2011}: (1) Definir un orden $\sigma$ sobre las variables ${\mathcal{X}}$. (2) Modificar cada DAG ${\mathcal{G}}_i$ para obtener un \textit{I-map} mínimo ${\mathcal{G}}_i^{\sigma}$ de ${\mathcal{G}}_i$ consistente\footnote{Un DAG $\mathcal{G}$ sobre ${\mathcal{X}}$ se considera consistente con un orden $\sigma$ de ${\mathcal{X}}$ si, para cada nodo $X \in \mathcal{X}$, todos los padres de $X$ en $\mathcal{G}$ preceden a $X$ en $\sigma$.} con $\sigma$. (3) Construir ${\mathcal{G}}^+$ como la unión de los arcos de todos los ${\mathcal{G}}_i^{\sigma}$, es decir, ${\mathcal{G}}^+ = \bigcup_{i=1}^r arcs({\mathcal{G}}^{\sigma}_i)$, donde $arcs({\mathcal{G}})$ devuelve el conjunto de arcos dirigidos en ${\mathcal{G}}$.

El \textit{Método A} \cite{pena_finding_2011} se aplica en el paso (2), manteniendo las independencias condicionales de cada ${\mathcal{G}}i$ codificadas por $d$-separación. Esto garantiza que ${\mathcal{G}}^+$ sea un \textit{I-map} mínimo de la intersección de los conjuntos de independencia de todos los grafos de entrada, es decir, $I({\mathcal{G}}^+) = \bigcap_{i=1}^r I({\mathcal{G}}_i)$. Para los fundamentos teóricos del \textit{Método A}, se remite al lector a \cite{pena_finding_2011}.

La elección del orden $\sigma$ es clave para determinar la estructura de ${\mathcal{G}}^+$. El \textit{Método A} aplica este orden a cada DAG de entrada ${\mathcal{G}}_i$, obteniendo el \textit{I-map} mínimo ${\mathcal{G}}_i^{\sigma}$ consistente con $\sigma$. Por ejemplo, las Figs. \ref{fig:ex1-original-RBs} y \ref{fig:ex2-transformed-RBs} muestran la transformación de los DAGs de la Fig. \ref{fig:ex1-original-RBs} utilizando el orden óptimo $\sigma^* = (X_1, X_2, X_4, X_3)$. Este orden $\sigma^*$ determina la RB fusionada mostrada en la Fig. \ref{fig:ex3-fusion-RBs} (izda.). %\textcolor{red}{no se dice nada de la Fig. 3 derecha}

Aunque encontrar el orden óptimo $\sigma$ es NP-duro, las heurísticas existentes \cite{Puerta2021Fusion} ofrecen de forma eficiente soluciones aproximadas que generan redes casi óptimas. Esto es crucial, ya que un $\sigma$ mal elegido puede resultar en fusiones muy complejas. El método de fusión propuesto en \cite{Puerta2021Fusion} captura todas las dependencias condicionales entre los DAGs de entrada $\mathbb{G} = \{\mathcal{G}_1, \dots, \mathcal{G}_r\}$, pero impone un criterio de ``todo o nada'': si una dependencia existe en alguna red ${\mathcal{G}}_i$, debe aparecer en la red fusionada $\mathcal{G}^+$.
%\textcolor{red}{pero esto sería la unión, ¿no?} 
Este enfoque genera redes densas con un \textit{treewidth} alto, lo que incrementa la carga computacional. Para mitigar esto, proponemos un enfoque de fusión más flexible, logrando un consenso en el subconjunto representativo de dependencias capturado y reduciendo el \textit{treewidth}.

%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
\subsection{Métricas para medir la similitud estructural de las RBs} \label{subsec:preliminaries_metrics} 
Existen varias métricas para evaluar la similitud estructural de las RBs. La distancia estructural de Hamming (SHD) \cite{tsamardinos_max-min_2006} cuantifica las diferencias estructurales mediante el número mínimo de modificaciones (adiciones, eliminaciones o inversiones) de arcos necesarias para alinear dos estructuras de RBs, pero no considera las independencias condicionales codificadas en las redes, lo que puede llevar a una representación incorrecta de la similitud \cite{Puerta2021Fusion}.

Para abordar esto, podemos utilizar la distancia estructural moral de Hamming (SMHD) \cite{Kim2019SHDMoral,Laborda2024_KBS,Torrijos2024_CEC}, que compara los grafos morales de dos RBs; y la \textit{Fusion Simmilarity} (\textsc{FSim}, introducida en \cite{Puerta2021Fusion}, Sección 6.2) que evalúa la similitud estructural basándose en los \textit{I-maps} mínimos de las redes bajo un orden topológico compartido $\sigma$. Mientras que la SMHD se enfoca en las diferencias estructurales, \textsc{FSim} se centra en medir las independencias condicionales codificadas por las RBs.

%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%
%                              PROBLEM DEFINITION
%
% - Measure of SMHD for the fusion of RBs (as in CEC)
% - Measure of SMHD/FusSim for the original RBs, with an example of why it is important
% - Treewidth
% - New greedies
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
\section{Definición del problema} \label{sec:problem_definition}
El método de fusión propuesto en \cite{Puerta2021Fusion} genera una red fusionada $\mathcal{G}^+$ que conserva todas las dependencias de las redes de entrada $\mathbb{G} = \{\mathcal{G}_1, \dots, \mathcal{G}_r\}$. Aunque es óptimo en la preservación de todas las dependencias condicionales, este enfoque suele dar lugar a una red densa con alto \textit{treewidth}. Para resolver esto, \cite{Torrijos2024_CEC} introdujo la \textit{Fusión Estructural Restringida de RBs}, que elimina selectivamente arcos en $\mathcal{G}^+$ para reducir el \textit{treewidth} bajo un límite, minimizando al mismo tiempo la SMHD con respecto a $\mathcal{G}^+$. Este enfoque busca aproximar $\mathcal{G}^+$ a una red más manejable denotada como $\mathcal{G}^+_{tw \leq t}$.

Sin embargo, usar $\mathcal{G}^+$ como referencia tiene limitaciones, ya que puede introducir complejidad innecesaria, especialmente si las redes de entrada contienen dependencias ruidosas o irrelevantes. En el ejemplo de la Fig. \ref{fig:ex1-treewidth} (con métricas\footnote{\textsc{tw} indica el \textit{treewidth} de la RB; $\text{SMHD}_{\mathcal{G}^+}$ es la SMHD con respecto a la fusión $\mathcal{G}^+$; \SMHD~es la SMHD media sobre las RBs iniciales $\mathbb{G}$; y \FSim~es la \textsc{FSim} media sobre $\mathbb{G}$} en la Tabla \ref{tab:ex1-ex2-metrics}), teniendo en cuenta solo las redes $\mathcal{G}$ y no las $\mathcal{H}$, tres redes de entrada (con \textit{treewidth} 2) se fusionan (Figs. \ref{subfig:ex1-BN1}, \ref{subfig:ex1-BN2} y \ref{subfig:ex1-BN3}). La fusión sin restricciones $\mathcal{G}^+$ (Fig. \ref{subfig:ex1-BNfusion})  tiene \textit{treewidth} 5, mientras que la fusión con \textit{treewidth} restringido, $\mathcal{G}^+_{tw \leq 3}$ (Fig. \ref{subfig:ex1-BNfusionLimitedG+}), consigue una red con \textit{treewidth} 3 eliminando solamente dos arcos de $\mathcal{G}^+$. 
%\textcolor{red}{el caption de la fig 4 (c) es bastante confuso, se dicen tres cosas. También la de (d)}
%
% Example 1
\begin{figure}[htb]
  \centering
      \subfloat[$\mathcal{G}_1$. \label{subfig:ex1-BN1}]{%
          \begin{tikzpicture}[->,>=stealth',shorten >=1pt,auto,node distance=0.95cm,  % DAG 1
                      semithick]
                \tikzstyle{every state}=[fill=none,draw=black,text=black]

                \node[state,inner sep=0.5pt,minimum size=0.5pt]         (X1)                      {$X_2$};
                \node[state,inner sep=0.5pt,minimum size=0.5pt]         (X4) [below left of=X1]          {$X_1$};
                \node[state,inner sep=0.5pt,minimum size=0.5pt]         (X3) [below right of=X1]         {$X_3$};
                \node[state,inner sep=0.5pt,minimum size=0.5pt]         (X2) [below of=X4]          {$X_5$};
                \node[state,inner sep=0.5pt,minimum size=0.5pt]         (X5) [below of=X3]          {$X_4$};

                \path (X1) edge [graph2]             node {} (X4)
                      (X1) edge [graph2]             node {} (X3)
                      (X4) edge [graph2]             node {} (X2)
                      (X3) edge [graph2]             node {} (X5);

              \end{tikzpicture}}
      \hspace{1cm}
      \subfloat[$\mathcal{G}_2$. \label{subfig:ex1-BN2}]{%
          \begin{tikzpicture}[->,>=stealth',shorten >=1pt,auto,node distance=0.95cm,
                      semithick]
                \tikzstyle{every state}=[fill=none,draw=black,text=black]
              
                \node[state,inner sep=0.5pt,minimum size=0.5pt]         (X1)                      {$X_1$};
                \node[state,inner sep=0.5pt,minimum size=0.5pt]         (X4) [below left of=X1]          {$X_3$};
                \node[state,inner sep=0.5pt,minimum size=0.5pt]         (X3) [below right of=X1]         {$X_4$};
                \node[state,inner sep=0.5pt,minimum size=0.5pt]         (X2) [below of=X4]          {$X_5$};
                \node[state,inner sep=0.5pt,minimum size=0.5pt]         (X5) [below of=X3]          {$X_2$};
                
                \path (X1) edge [graph2]             node {} (X4)
                      (X1) edge [graph2]             node {} (X3)
                      (X4) edge [graph2]             node {} (X2)
                      (X3) edge [graph2]             node {} (X5);
              \end{tikzpicture}}
      \hspace{0.5cm}
      \subfloat[$\mathcal{G}_3$, $\{\mathcal{H}_i\}_{i=1}^{99}$, $\mathcal{H}^*_{tw\leq 3}$. \label{subfig:ex1-BN3}]{%
          \begin{tikzpicture}[->,>=stealth',shorten >=1pt,auto,node distance=0.95cm,
                      semithick]
                \tikzstyle{every state}=[fill=none,draw=black,text=black]
              
                \node[state,inner sep=0.5pt,minimum size=0.5pt]         (X1)                      {$X_3$};
                \node[state,inner sep=0.5pt,minimum size=0.5pt]         (X4) [below left of=X1]          {$X_1$};
                \node[state,inner sep=0.5pt,minimum size=0.5pt]         (X3) [below right of=X1]         {$X_5$};
                \node[state,inner sep=0.5pt,minimum size=0.5pt]         (X2) [below of=X4]          {$X_4$};
                \node[state,inner sep=0.5pt,minimum size=0.5pt]         (X5) [below of=X3]          {$X_2$};

                \node[state,inner sep=0.5pt,minimum size=0.5pt,draw=none, fill=none]         (t1) [left of=X1, xshift=-0.6cm]          {};
                \node[state,inner sep=0.5pt,minimum size=0.5pt,draw=none, fill=none]         (t2) [right of=X1, xshift=0.6cm]          {};
                
                \path (X1) edge [graph2]             node {} (X4)
                      (X1) edge [graph2]             node {} (X3)
                      (X4) edge [graph2]             node {} (X2)
                      (X3) edge [graph2]             node {} (X5);
              \end{tikzpicture}}
      \\
      \vspace{-0.8cm}
      \subfloat[$\mathcal{G}^+$, $\mathcal{H}^+$, $\mathcal{H}_{100}$. \label{subfig:ex1-BNfusion}]{%
          \begin{tikzpicture}[->,>=stealth',shorten >=1pt,auto,node distance=0.9cm,
                      semithick]
                \tikzstyle{every state}=[fill=none,draw=black,text=black]
              
                \node[state,inner sep=0.5pt,minimum size=0.5pt]         (X4)           {$X_4$};
                \node[state,inner sep=0.5pt,minimum size=0.5pt]         (X2) [below left of=X4]         {$X_2$};
                \node[state,inner sep=0.5pt,minimum size=0.5pt]         (X3) [below right of=X4]          {$X_3$};
                \node[state,inner sep=0.5pt,minimum size=0.5pt]         (X5) [below right of=X2]          {$X_5$};
                \node[state,inner sep=0.5pt,minimum size=0.5pt]         (X1) [above right of=X3]                {$X_1$};
                
                \path (X1) edge [graph2, bend right=75]             node {} (X2)
                      (X1) edge [graph2]             node {} (X4)
                      (X1) edge [graph2]             node {} (X3)
                      (X1) edge [graph2, bend left=50]             node {} (X5)

                      (X3) edge [graph2]             node {} (X4)
                      (X3) edge [graph2]             node {} (X5)
                      (X3) edge [graph2]             node {} (X2)

                      (X4) edge [graph2]             node {} (X2)
                      (X5) edge [graph2]             node {} (X2);
              \end{tikzpicture}}
      \hspace{0.3cm}
      \subfloat[$\mathcal{G}^+_{tw\leq3}$. \label{subfig:ex1-BNfusionLimitedG+}]{%
          \begin{tikzpicture}[->,>=stealth',shorten >=1pt,auto,node distance=0.9cm,
                      semithick]
                \tikzstyle{every state}=[fill=none,draw=black,text=black]
              
                \node[state,inner sep=0.5pt,minimum size=0.5pt]         (X4)           {$X_4$};
                \node[state,inner sep=0.5pt,minimum size=0.5pt]         (X2) [below left of=X4]         {$X_2$};
                \node[state,inner sep=0.5pt,minimum size=0.5pt]         (X3) [below right of=X4]          {$X_3$};
                \node[state,inner sep=0.5pt,minimum size=0.5pt]         (X5) [below right of=X2]          {$X_5$};
                \node[state,inner sep=0.5pt,minimum size=0.5pt]         (X1) [above right of=X3]                {$X_1$};
                
                \path (X1) edge [graph2, bend right=75]             node {} (X2)
                      (X1) edge [graph2]             node {} (X4)
                      (X1) edge [graph2]             node {} (X3)
                      (X1) edge [graph2, bend left=50]             node {} (X5)

                      (X3) edge [graph2]             node {} (X4)
                      (X3) edge [graph2]             node {} (X5)
                      
                      (X4) edge [graph2]             node {} (X2);
              \end{tikzpicture}}
      \hspace{0.3cm}
      \subfloat[$\mathcal{G}^*_{tw\leq3}$. \label{subfig:ex1-BNfusionLimitedG*}]{%
          \begin{tikzpicture}[->,>=stealth',shorten >=1pt,auto,node distance=0.9cm,
                      semithick]
                \tikzstyle{every state}=[fill=none,draw=black,text=black]
              
                \node[state,inner sep=0.5pt,minimum size=0.5pt]         (X4)           {$X_4$};
                \node[state,inner sep=0.5pt,minimum size=0.5pt]         (X2) [below left of=X4]         {$X_2$};
                \node[state,inner sep=0.5pt,minimum size=0.5pt]         (X3) [below right of=X4]          {$X_3$};
                \node[state,inner sep=0.5pt,minimum size=0.5pt]         (X5) [below right of=X2]          {$X_5$};
                \node[state,inner sep=0.5pt,minimum size=0.5pt]         (X1) [above right of=X3]                {$X_1$};
                
                \path (X1) edge [graph2]             node {} (X4)
                      (X1) edge [graph2]             node {} (X3)

                      (X3) edge [graph2]             node {} (X5);
              \end{tikzpicture}}
  \caption{Distintas fusiones de $\{\mathcal{G}_1,\mathcal{G}_2,\mathcal{G}_3\}$ y $\{\mathcal{H}_i\}_{i=1}^{100}$.}
  \label{fig:ex1-treewidth}
\end{figure}
%
%
\begin{table}[htb]
  \caption{Métricas para las RBs de la Fig. \ref{fig:ex1-treewidth}. Los guiones indican casos en los que la métrica no tiene sentido, como cuando implicaría autocomparaciones.}
  \label{tab:ex1-ex2-metrics}
  \resizebox{\columnwidth}{!} {%
    \begin{tabular*}{1.6\textwidth}{@{\extracolsep{\fill}}@{\hspace{0.1em}}l@{\hspace{0.5em}}S[table-format=1.0]@{\hspace{0.5em}}S[table-format=1.0]@{\hspace{0.5em}}S[table-format=1.3]@{\hspace{0.5em}}S[table-format=1.3]@{\hspace{1em}}l@{\hspace{0.5em}}S[table-format=1.0]@{\hspace{0.5em}}S[table-format=1.0]@{\hspace{0.5em}}S[table-format=1.3]@{\hspace{0.5em}}S[table-format=1.3]@{\hspace{0.1em}}}
    \toprule
    \multicolumn{1}{c}{\multirow{2}{*}{\textsc{\bfseries RB}}}
    & \multicolumn{4}{c}{\textsc{\bfseries Ejemplo 1}} 
    & \multicolumn{1}{c}{\multirow{2}{*}{\textsc{\bfseries RB}}}
    & \multicolumn{4}{c}{\textsc{\bfseries Ejemplo 2}} \\
    \cmidrule(r){2-5} \cmidrule(){7-10}
    & \textsc{tw} & \textsc{$\text{SMHD}_{\mathcal{G}^+}$} & \textsc{SMHD$_{\mathbb{G}}$} & \textsc{FSim$_{\mathbb{G}}$} 
    & & \textsc{tw} & \textsc{$\text{SMHD}_{\mathcal{H}^+}$} & \textsc{SMHD$_{\mathbb{H}}$} & \textsc{FSim$_{\mathbb{H}}$} \\
    \cmidrule[0.8pt](r){1-5}\cmidrule[0.9pt](){6-10}
    $\{\mathcal{G}_1,\mathcal{G}_2,\mathcal{G}_3\}$   & 2 & 6 & {---} & {---} &       $\{\mathcal{H}_i\}_{i=1}^{99}$  & 2 & 6   & {---} & {---} \\
                                     & & & & &                      $\mathcal{H}_{100}$             & 5 & 0 & {---} & {---} \\
    $\mathcal{G}^+$                  & 5 & {---} & 6 & 7.33 &       $\mathcal{H}^+$                 & 5 & {---} & 5.94 & 4.95 \\
    $\mathcal{G}^+_{tw\leq3}$        & 3 & \B 3 & 4.33 & 5.33 &     $\mathcal{H}^+_{tw\leq3}$       & 3 & \B 3 & 3 & 2.99 \\
    $\mathcal{G}^*_{tw\leq3}$        & 2 & 7 & \B 3 & \B 3.33 &     $\mathcal{H}^*_{tw\leq3}$       & 2 & 6 & \B 0.06 & \B 0.05 \\
    \bottomrule
    \end{tabular*}
  }
\end{table}
%

En la misma Fig. \ref{fig:ex1-treewidth}, si observamos el ejemplo formado por las RBs $\mathcal{H}$, el efecto del ruido es más pronunciado. Aquí, 99 redes con \textit{treewidth} 2 comparten dependencias (Fig. \ref{subfig:ex1-BN3}), pero una red $\mathcal{H}_{100}$ (Fig. \ref{subfig:ex1-BNfusion}) introduce dependencias espurias. Esto puede ocurrir en un escenario de aprendizaje federado con un cliente malicioso. Como resultado, la fusión sin restricciones $\mathcal{H}^+$ (Fig. \ref{subfig:ex1-BNfusion}) replica las dependencias ruidosas de $\mathcal{H}_{100}$. Incluso con el \textit{treewidth} limitado, $\mathcal{H}^+_{tw \leq 3}$ (Fig. \ref{subfig:ex1-BNfusionLimitedG+}) no refleja el consenso mayoritario debido a la influencia de $\mathcal{H}_{100}$.

Estos ejemplos demuestran cómo usar $\mathcal{G}^+$ como referencia puede llevar a una red fusionada compleja que no refleja adecuadamente las (in)dependencias de las redes de entrada. Proponemos una nueva definición que evita esto y mide la similitud con cada red de entrada $\mathcal{G}_i$. La red fusionada se define como aquella que minimiza la distancia estructural promedio con las redes de entrada bajo una restricción de \textit{treewidth}, capturando las dependencias compartidas y mitigando el ruido o los errores.

\begin{definition}[Consenso estructural restringido de Redes Bayesianas]\label{def:problem_new} 
    Sea $\mathbb{G} = \{{\mathcal{G}}_1, \dots, {\mathcal{G}}_r\}$ el conjunto de DAGs de $r$ RBs definidas sobre el mismo dominio. El objetivo del consenso estructural restringido con respecto a los grafos de entrada es obtener un grafo fusionado $\mathcal{G}^*_{tw \leq t}$, que maximice la similitud media entre el grafo fusionado ${\mathcal{G}}$ y los grafos de entrada ${\mathcal{G}}_i$, sujeto a una restricción de \textit{treewidth}, y minimizando una métrica de distancia estructural definida. Específicamente, para un valor máximo de \textit{treewidth} $t \in \mathds{N}$, con $t \geq 2$, la fusión estructural restringida se define como 
    \begin{equation} 
        \mathcal{G}^*_{tw \leq t} = \arg \min_{\mathcal{G}; \,\textrm{tw}(\mathcal{G}) \leq t} \frac{1}{r} \sum_{i=1}^{r} Metric\, (\mathcal{G}, \mathcal{G}_i)
    \label{eq:problem_new} 
    \end{equation} donde $\textrm{Metric}\ ({\mathcal{G}}, {\mathcal{G}}_i)$ representa una métrica de distancia estructural, como \textsc{SMHD} o \textsc{FSim}, utilizada para evaluar la similitud entre el grafo fusionado ${\mathcal{G}}$ y cada una de las redes originales ${\mathcal{G}}_i$. 
\end{definition}

Esta definición relaja la noción de \textit{fusión} a un \textit{consenso}, donde la red resultante $\mathcal{G}^*_{tw \leq t}$ captura las dependencias esenciales compartidas entre las redes de entrada, bajo la restricción de \textit{treewidth}. Volviendo al ejemplo de $\mathcal{G}$, en la Fig. \ref{fig:ex1-treewidth}, aunque las redes de entrada tienen estructuras simples, sus independencias condicionales varían, lo que hace que la fusión sin restricciones $\mathcal{G}^+$ sea compleja. Nuestro enfoque de consenso (Fig. \ref{subfig:ex1-BNfusionLimitedG*}) genera una red $\mathcal{G}^*_{tw\leq 3}$ con menos arcos incluso que las redes de entrada, reflejando la falta de consenso en dichas redes iniciales. Las métricas en la Tabla \ref{tab:ex1-ex2-metrics} muestran que $\mathcal{G}^+_{tw\leq 3}$ logra un mejor SMHD$_\mathcal{G^+}$, mientras que $\mathcal{G}^*_{tw\leq 3}$ mejora el \SMHD~y \FSim~.

Este efecto es aún más claro en el ejemplo de $\mathcal{H}$ (Fig. \ref{fig:ex1-treewidth}). El enfoque de consenso $\mathcal{H}^*_{tw\leq 3}$ 
%\textcolor{red}{referirse a Fig. 4 c} %Fig. \ref{subfig:ex1-BN3}
refleja la estructura compartida de $\{\mathcal{H}_i\}_{i=1}^{99}$ y omite el ruido introducido por $\mathcal{H}_{100}$, al contrario que $\mathcal{H}^+$ y $\mathcal{H}^+_{tw \leq 3}$. Como se muestra en la Tabla \ref{tab:ex1-ex2-metrics}, el nuevo enfoque ofrece mejores valores en \SMHD~y \FSim~al replicar la estructura ideal compartida por la mayoría de las redes de entrada.

Una ventaja adicional de este enfoque de consenso es que, a diferencia del método de fusión restringida de \cite{Torrijos2024_CEC}, que tiende a explotar el \textit{treewidth} máximo permitido $t$ para minimizar SMHD$_\mathcal{G^+}$, genera RBs de consenso $\mathcal{G}^*_{tw\leq t}$ que tienden a mantienen \textit{treewidths} similares o incluso menores que los de las redes de entrada, lo que facilita el aprendizaje y la inferencia eficientes.


%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%
%                             ALGORITHM DESCRIPTION
%
% - Description of the algorithm
% - Chromosome representation (different from CEC)
% - Fitness function (addapting SMHD/FusSim)
% - Algoritmo structure
% - Initialization, selection, crossover, mutation, pupulation updating
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
\section{Algoritmo genético para el consenso de RBs bajo restricciones de \textit{treewidth}} \label{sec:algorithm}
Este trabajo presenta un algoritmo genético para el consenso de RBs introducido en la Definición \ref{def:problem_new} bajo una restricción de \textit{treewidth} ($t$). El enfoque elimina arcos de las redes de entrada para construir una estructura de consenso equilibrando similitud estructural y viabilidad computacional. Mediante la integración de una inicialización voraz y operadores genéticos específicamente diseñados para el problema, el algoritmo garantiza una exploración y explotación eficientes del espacio de búsqueda, respetando la limitación de \textit{treewidth}.


%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
\subsection{Representación del cromosoma} \label{subsec:algorithm_chromosome}

%La representación de un cromosoma $C$ depende de la elección del conjunto de arcos $\mathcal{E}$ \textcolor{red}{concretar qué es este conjunto de arcos, o de entre dónde se eligen, no ha aparecido antes en ningún sitio}, con dos configuraciones posibles:
La representación de un cromosoma $C$ depende de la elección del conjunto de arcos $\mathcal{E}$, que corresponde a los enlaces considerados en el proceso de fusión. Se definen dos configuraciones posibles:

\paragraph{Sin Repetición (\Eb):} $C$ representa todos los arcos únicos de las redes de entrada, es decir, $\mathcal{E}_{\mathbb{G}} = \bigcup_{i=1}^r \text{enlaces}(\mathcal{G}_i)$. Sea $s = |\mathcal{E}_{\mathbb{G}}|$, con los arcos ordenados lexicográficamente por sus subíndices (por ejemplo, $a_{1,3} \prec a_{1,6} \prec a_{3,4}$). Un cromosoma $C \in \{0,1\}^s$ codifica si cada arco está incluido (1) o excluido (0) en todas las redes de entrada.

\paragraph{Con Repetición (\Ec):} $C$ representa los arcos de cada red de entrada por separado, es decir, $\mathcal{E}_{\mathbb{G}}^* = \bigsqcup_{i=1}^r \text{enlaces}(\mathcal{G}_i)$. Sea $s^* = |\mathcal{E}_{\mathbb{G}}^*|$, con los arcos ordenados lexicográficamente por sus subíndices y la red a la que pertenecen (por ejemplo, $a_{2,3}^1 \prec a_{3,4}^1 \prec a_{1,2}^3 \prec a_{2,3}^3$). Un cromosoma $C \in \{0,1\}^{s^*}$ especifica la inclusión (1) o exclusión (0) de cada arco independientemente en cada red.

\paragraph{Equilibrio:} La elección entre \Eb~ y \Ec~ balancea simplicidad y flexibilidad. \Eb~ define un espacio de búsqueda más pequeño y rápido pero menos específico, mientras \Ec~ permite eliminar enlaces para cada red, pudiendo lograr mejores soluciones a costa de un mayor espacio de búsqueda.


%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
\subsection{Función de \textit{fitness}} \label{subsec:algorithm_fitness}
La función de \textit{fitness} evalúa un cromosoma $C$ en función de la similitud del grafo fusionado $\mathcal{G}^*_C$ con las redes de entrada originales $\{\mathcal{G}_1, \dots, \mathcal{G}_r\}$, penalizando violaciones de la restricción de \textit{treewidth}.

Dado $C$, los grafos de entrada modificados $\{\mathcal{G}_C^1, \dots, \mathcal{G}_C^r\}$ se definen como: \begin{equation*}
    \mathcal{G}_C^i = (\mathcal{X}, \mathcal{E}_C^i); \; \mathcal{E}_C^i = 
    \begin{cases} 
        \{a_{jk}^i \in \text{enlaces}(\mathcal{G}_i) \mid C(a_{jk}^i) = 1\}, & \text{si } \mathcal{E} = \mathcal{E}_{\mathbb{G}}^* \\
        \{a_{jk} \in \text{enlaces}(\mathcal{G}_i) \mid C(a_{jk}) = 1\}, & \text{si } \mathcal{E} = \mathcal{E}_{\mathbb{G}}
    \end{cases}
\end{equation*}

El grafo fusionado $\mathcal{G}^*_C$ se obtiene aplicando el método de la Sección \ref{subsec:fusion_bns} \cite{Puerta2021Fusion} a $\{\mathcal{G}_C^1, \dots, \mathcal{G}_C^r\}$. El \textit{fitness} se calcula como: \begin{equation*}
    f(C) = \frac{1}{r} \sum_{i=1}^r \text{Metric}(\mathcal{G}^*_C, \mathcal{G}_i) \cdot 
    \begin{cases} 
        1, & \text{si } \text{tw}(\mathcal{G}^*_C) \leq t, \\
        \frac{\text{tw}(\mathcal{G}^*_C)}{t} & \text{e.o.c.,}
    \end{cases}
\end{equation*}
donde $\text{tw}(\mathcal{G})$ denota el \textit{treewidth} de $\mathcal{G}$. Minimizar $f(C)$ asegura una alta similitud estructural con las redes de entrada, manteniendo la restricción de \textit{treewidth}. El término de penalización guía la búsqueda fuera de soluciones no viables.

%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
\subsection{Estructura del algoritmo} \label{subsec:algorithm_structure}
El algoritmo genético propuesto, detallado en el Alg. \ref{alg:genetic}, resuelve el consenso de RBs bajo una restricción de \textit{treewidth} (Definición \ref{def:problem_new}). La decodificación de cromosomas y el cálculo de la función de \textit{fitness} son tareas computacionales exigentes, por lo que es necesario equilibrar calidad y eficiencia.

\begin{figure}[htbp]

  \resizebox{0.49\textwidth}{!}{%
      \begin{minipage}{0.8\textwidth}
        \raggedright
        \begin{algorithm}[H]
        \caption{Poda de enlaces genética pre-fusión para consenso de RBs}
        \label{alg:genetic}
        \begin{algorithmic}[1] 
            \Require $\{{\mathcal{G}}_1, \dots,{\mathcal{G}}_r\}$ sobre ${\mathcal{X}}$; $t \geq 2$; $nIts$; $tamPob$; $rep$ (bool)
            \Ensure $\{{\mathcal{G}}_1^*, \dots,{\mathcal{G}}_r^*\}, {\mathcal{G}}^*_{tw \leq t}$
        
                \State $\mathcal{E} \leftarrow \left\{
                    \begin{array}{ll}
                    \bigsqcup_{i=1}^r \textrm{enlaces}(\mathcal{G}_i) & \text{si } rep \\ 
                    \bigcup_{i=1}^r \textrm{enlaces}(\mathcal{G}_i) & \text{e.o.c.}
                    \end{array}
                    \right.$
        
                \State $\left\{
                    \begin{array}{ll}
                        \#(a_{jk}^i) \leftarrow \sum_{i=1}^r {\mathds{1}}(a_{jk}^i \in \mathcal{G}_i), \; \forall a_{jk}^i \in \mathcal{E} & \text{si } rep \\
                        \#(a_{jk}) \leftarrow \sum_{i=1}^r {\mathds{1}}(a_{jk} \in \mathcal{G}_i), \; \forall a_{jk} \in \mathcal{E} & \text{e.o.c.}
                    \end{array}
                    \right.$
                    
                \State $\{{\mathcal{G}}_1^*, \dots,{\mathcal{G}}_r^*\} \leftarrow \textrm{grafos vacíos definidos sobre} \; {\mathcal{X}}$
                \State $C^*, C^l \leftarrow \emptyset$  \Comment{Mejor cromosoma hasta el momento/en la última it.}
        
                \State $\mathcal{C}_{gr} \leftarrow \{\textrm{Alg. \ref{alg:greedy}}(\{{\mathcal{G}}_1, \dots,{\mathcal{G}}_r\}, t, rep)\}$
                \State $\mathcal{C}_{gr} \leftarrow \mathcal{C}_{gr} \cup \{\textrm{Alg. \ref{alg:greedy}}(\{{\mathcal{G}}_1, \dots,{\mathcal{G}}_r\}, t - 1, rep)\} \; \text{si } t > 2$
                \State $\mathcal{C} \leftarrow \textrm{inicialización}(tamPob - |\mathcal{C}_{gr}|, \#(a_{jk}), \mathcal{E}) \cup \mathcal{C}_{gr}$
        
                \For{$i \leftarrow 1 \textrm{ to } nIts$} 
                    \State $C^*, C^l, \{{\mathcal{G}}_1^*, \dots,{\mathcal{G}}_r^*\}, {\mathcal{G}}^*_{tw \leq t} \leftarrow$ \textrm{evaluar}($\mathcal{C},\{{\mathcal{G}}_1, \dots,{\mathcal{G}}_r\})$
                    \State $\mathcal{C} \leftarrow \textrm{selección}(\mathcal{C})$
                    \State $\mathcal{C} \leftarrow \textrm{cruce}(\mathcal{C})$ 
                    \State $\mathcal{C} \leftarrow \textrm{mutación}(\mathcal{C})$
                    \State $\mathcal{C} \leftarrow \mathcal{C} \cup \{C^*,C^l\}$ \Comment{Elitismo}
                \EndFor
                \State Return $\{{\mathcal{G}}_1^*, \dots,{\mathcal{G}}_r^*\}, {\mathcal{G}}^*_{tw \leq t}$
            \end{algorithmic}
        \end{algorithm}
      \end{minipage}%
    }
  \hspace{0.01\textwidth}
  \resizebox{0.49\textwidth}{!}{%
      \begin{minipage}{0.8\textwidth}
        \raggedleft
        \begin{algorithm}[H]
        \caption{Poda de enlaces voraz pre-fusión para consenso de RBs}
        \label{alg:greedy}
            \begin{algorithmic}[1] 
                \Require $\{{\mathcal{G}}_1, \dots,{\mathcal{G}}_r\}$ sobre ${\mathcal{X}}$; $t \geq 2$; $rep$ (bool)
                \Ensure $\{{\mathcal{G}}_1^*, \dots,{\mathcal{G}}_r^*\}, {\mathcal{G}}^*_{tw \leq t}$
            
                    \State $\mathcal{E} \leftarrow \left\{
                        \begin{array}{ll}
                            \bigsqcup_{i=1}^r \textrm{enlaces}(\mathcal{G}_i) & \text{si}\ rep \\ 
                            \bigcup_{i=1}^r \textrm{enlaces}(\mathcal{G}_i) & \text{e.o.c.}
                        \end{array}
                        \right.$
            
                    \State $\left\{
                        \begin{array}{ll}
                            \#(a_{jk}^i) \leftarrow \sum_{i=1}^r {\mathds{1}}(a_{jk}^i \in \mathcal{G}_i), \; \forall a_{jk}^i \in \mathcal{E} & \text{si } rep \\
                            \#(a_{jk}) \leftarrow \sum_{i=1}^r {\mathds{1}}(a_{jk} \in \mathcal{G}_i), \; \forall a_{jk} \in \mathcal{E} & \text{e.o.c.}
                        \end{array}
                        \right.$
            
                    \State $\{{\mathcal{G}}_1^*, \dots,{\mathcal{G}}_r^*\} \leftarrow \textrm{grafos vacíos definidos cobre} \; {\mathcal{X}}$
                    \State ${\mathcal{G}}^*_{tw \leq t} \leftarrow \emptyset$
            
                    \While {$\mathcal{E} \neq \emptyset$}
                        \State $a_{jk} \gets \arg\max_{a_{jk} \in \mathcal{E}} \#(a_{jk})$
                        \State $\mathcal{E} \gets \mathcal{E} \setminus \{a_{jk}\}$
                        \State $\mathcal{G}_i^* \leftarrow \left\{
                            \begin{array}{ll}
                            \mathcal{G}_i^* \cup \{a_{jk}^i\}, \forall i :a_{jk}^i \in \text{enlaces}(\mathcal{G}_i) & \text{si } rep \\ 
                            \mathcal{G}_i^* \cup \{a_{jk}\}, \text{for } \exists! i : a_{jk} \in \text{enlaces}(\mathcal{G}_i) & \text{e.o.c.}
                            \end{array}
                            \right.$
            
                        \State $\sigma \leftarrow$ un orden para ${\mathcal{X}}$ \Comment Usa \cite{Puerta2021Fusion}
                        
                        \State ${\mathcal{G}}^{\sigma}_i \leftarrow A({\mathcal{G}}_i^*, \sigma) \; \forall i \in \{1, \dots, r\}$
            
                        \If{$\textrm{tw}(\bigcup_{i=1}^r {\mathcal{G}}^{\sigma}_i) \leq t$}
                            \State ${\mathcal{G}}^*_{tw \leq t} \leftarrow \bigcup_{i=1}^r {\mathcal{G}}^{\sigma}_i$
                        \Else
                            \State $\mathcal{G}_i^* \leftarrow \left\{
                                \begin{array}{ll}
                                \mathcal{G}_i^* \setminus \{a_{jk}^i\}, \forall i : a_{jk}^i \in \text{enlaces}(\mathcal{G}_i) & \text{si } rep \\ 
                                \mathcal{G}_i^* \setminus \{a_{jk}\}, \text{for } \exists! i : a_{jk} \in \text{enlaces}(\mathcal{G}_i) & \text{e.o.c.}
                                \end{array}
                                \right.$
                        \EndIf
                    \EndWhile
                    
                    \State Return $\{{\mathcal{G}}_1^*, \dots,{\mathcal{G}}_r^*\}, {\mathcal{G}}^*_{tw \leq t}$
            
                \end{algorithmic}
            \end{algorithm}
        \end{minipage}
    }
\end{figure}

Debido al crecimiento exponencial del espacio de búsqueda con el tamaño de $|\mathcal{E}|$, el algoritmo utiliza un enfoque en el que se intenta maximizar los resultados obtenidos por iteración. Se evita usar tamaños de población o iteraciones excesivas, priorizando una inicialización eficiente y operadores específicos para maximizar la efectividad. 

Las características clave del algoritmo genético incluyen una inicialización híbrida, combinando soluciones heurísticas del algoritmo voraz (Alg. \ref{alg:greedy}) con cromosomas aleatorios para mejorar la diversidad y la calidad; operadores específicos, diseñados para adaptarse a la naturaleza del espacio de búsqueda sin ser excesivamente restrictivos; y un \textit{fitness} guiado por las restricciones, penalizando las soluciones que superan la restricción de \textit{treewidth} para orientar la población hacia soluciones viables. A continuación, se detallan los operadores del algoritmo genético.

%\begin{itemize} 
%    \item \textbf{Inicialización híbrida}: Combina soluciones heurísticas del algoritmo voraz (Alg. \ref{alg:greedy}) con cromosomas aleatorios para mejorar la diversidad y la calidad. 
%    \item \textbf{Operadores específicos}: La mutación se adapta a la naturaleza del espacio de búsqueda, optimizando la generación de soluciones de alta calidad. 
%    \item \textbf{\textit{Fitness} guiado por restricciones}: Se penalizan las soluciones que superan la restricción de \textit{treewidth}, orientando la población hacia soluciones viables. 
%\end{itemize}


%%%%%%%%%%%%%%%%%%%%%%% 
\subsubsection{Inicialización} \label{subsubsec:algorithm_initialization} 
La inicialización de la población (tamaño $tamPob$) combina soluciones heurísticas del algoritmo \textit{voraz de poda de arcos pre-fusión} (Alg. \ref{alg:greedy}) con muestreo probabilístico para garantizar calidad y diversidad. El algoritmo voraz agrega iterativamente arcos respetando las restricciones de \textit{treewidth}. Con él generamos dos cromosomas: uno para \textit{treewidth} $t$ y otro para $t - 1$ (si $t > 2$).

Los cromosomas restantes se inicializan probabilísticamente según las frecuencias de los arcos $\#(a_{jk})$ en las redes de entrada\footnote{Por abuso de notación, $a_{jk}$ hace referencia tanto a $a_{jk}$ como a $a_{jk}^i$ en este párrafo.}. Para cada arco $a_{jk} \in \mathcal{E}$, su probabilidad de inclusión es $\mathbb{P}(C(a_{jk}) = 1) = \frac{1}{1 - \log(x)}$, donde $x$ es el valor normalizado min-max\footnote{Cuando $\#(a_{jk})$ es igual para todos los arcos, se lleva a cabo una inicialización aleatoria uniforme ($\mathbb{P} = 0.5$).} de $\#(a_{jk})$.

%%%%%%%%%%%%%%%%%%%%%%% 
\subsubsection{Cruce} \label{subsec:algorithm_crossover} 
El cruce empareja a los individuos seleccionados y aplica un cruce de un solo punto aleatorio, dividiendo los cromosomas en dos partes y combinándolas para generar una nueva población con $tamPob$ individuos.

%%%%%%%%%%%%%%%%%%%%%%% 
\subsubsection{Mutación} \label{subsec:algorithm_mutation} 
En la etapa de mutación, todos los cromosomas son candidatos a modificaciones. Las probabilidades de agregar o eliminar arcos se ajustan dinámicamente según la relación $x = \frac{\text{tw}(\mathcal{G}^*_C)}{t}$, equilibrando exploración y explotación. La probabilidad de mutación se define de la siguiente forma:%
%
\begin{equation*}
    \begin{aligned}
    \mathbb{P}(\text{añadir}) &=
        \begin{cases}
        \left(\frac{x-1}{2}\right)^2 + 0.01, & \text{si } x \leq 1, \\
        \frac{0.01}{x}, & \text{si} x > 1,
        \end{cases} 
    \hspace{0.7cm}
    \mathbb{P}(\text{eliminar}) &=
        \begin{cases}
        \frac{x}{10}, & \text{si } x \leq 1, \\
        \frac{\log(x)}{3} + 0.01, & \text{si } x > 1.
        \end{cases}
    \end{aligned}
\end{equation*}
%
Cada arco se muta independientemente. Para agregar un arco, un arco candidato $a_{jk} \notin \mathcal{E}_C$ se agrega con probabilidad $\mathbb{P}(\text{añadir})$. Para eliminar un arco, un arco existente $a_{jk} \in \mathcal{E}_C$ se elimina con probabilidad $\mathbb{P}(\text{eliminar})$. Este enfoque adaptativo favorece la exploración equilibrada del espacio de búsqueda y dirige las soluciones hacia la región factible con \textit{treewidth} $\leq t$.

%%%%%%%%%%%%%%%%%%%%%%% 
\subsubsection{Actualización de la población} \label{subsec:algorithm_population_update} 
Después de la mutación, la población se actualiza utilizando una estrategia elitista. Los dos individuos menos aptos son reemplazados por $C^*$, el mejor cromosoma encontrado durante el proceso evolutivo, y $C^l$, el mejor de la generación anterior. Este enfoque asegura que el material genético de alta calidad persista a lo largo de las generaciones, manteniendo diversidad para evitar convergencias prematuras.


%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%
%                            EXPERIMENTAL EVALUATION
%
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
\section{Evaluación experimental} \label{sec:experimental_evaluation}
Nuestro enfoque experimental sigue el de \cite{Puerta2021Fusion,Torrijos2024_CEC}, ampliado con RBs más grandes y nuevas métricas.

%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
\subsection{Redes / conjuntos de datos} \label{subsec:exp_networks}
Siguiendo \cite{Torrijos2024_CEC}, evaluamos con redes sintéticas y reales. Los DAGs de entrada $\mathbb{G} = \{\mathcal{G}_1,\dots,\mathcal{G}_r\}$ se generan a partir de un DAG base $\mathcal{G}_0$ aplicando el método de \cite{Puerta2021Fusion,Torrijos2024_CEC}. Cada red de $\mathbb{G}$ sufre $p = n \cdot 0.75$ perturbaciones, donde $n$ es el número de nodos. En cada perturbación, se agrega o elimina aleatoriamente un arco $\{X \rightarrow Y\}$, garantizando aciclicidad. La complejidad de la RB se limita a 3 padres, 4 hijos y $e = n \cdot 2.5$ arcos por nodo, manteniendo similitud estructural con $\mathcal{G}_0$. Para las redes sintéticas, $\mathcal{G}_0$ se genera con el método de \cite{Melanon2004}, como en \cite{Puerta2021Fusion,Torrijos2024_CEC}. Para las redes reales, utilizamos las siete RBs del \textit{Bayesian Network Repository} de \texttt{bnlearn}\footnote{\url{https://www.bnlearn.com/bnrepository/}} con entre 20 y 56 nodos\footnote{\textsc{Child}, \textsc{Insurance}, \textsc{Water}, \textsc{Mildew}, \textsc{Alarm}, \textsc{Barley} y \textsc{Hailfinder}.}.

%Para facilitar el aprendizaje paramétrico en las RBs generadas y evaluar su uso para inferencia en diferentes límites de \textit{treewidth}, también generamos muestras de 5000 instancias para cada RB real utilizando el DAG y los parámetros correspondientes.

%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
\subsection{Algoritmos} \label{subsec:algorithms}
Este estudio evalúa el rendimiento de los algoritmos genético y voraz para el consenso de RBs bajo una restricción de \textit{treewidth}, considerando varias configuraciones del conjunto de arcos candidatos:

\begin{itemize} 
    \item \textbf{\Ea:} Los arcos provienen de la red fusionada $\mathcal{G}^+$ como en \cite{Torrijos2024_CEC}. Los algoritmos de \cite{Torrijos2024_CEC} se adaptan para optimizar métricas respecto a los grafos de entrada originales en lugar de $\mathcal{G}^+$. 
    %\textcolor{red}{De este caso no has hablado en la Sección 4.1 cuando veíamos los posibles conjuntos de arcos. Por otra parte, revisa bien lo de \Eb y \Ec en todo el paper}
    \item \textbf{\Eb:} Los arcos son únicos entre las redes de entrada, \Eb$ = \bigcup_{i=1}^r \textrm{enlaces}(\mathcal{G}_i)$. Se aplican el algoritmo genético propuesto (Alg. \ref{alg:genetic}) y su base voraz (Alg. \ref{alg:greedy}) con decisiones de inclusión uniformes (\texttt{rep = False}).
    \item \textbf{\Ec:} Los arcos incluyen repeticiones de cada red de entrada, \Ec$ = \bigsqcup_{i=1}^r \textrm{enlaces}(\mathcal{G}_i)$. Se aplican Alg. \ref{alg:genetic} y Alg. \ref{alg:greedy} para permitir decisiones de inclusión independientes (\texttt{rep = True}). 
\end{itemize}

%Este enfoque nos permite investigar cómo el algoritmo adaptado de \cite{Torrijos2024_CEC} se desempeña en el nuevo marco de consenso, y si eliminar los arcos antes de la fusión mejora la calidad de la RB de consenso.


%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
\subsection{Reproducibilidad} \label{subsec:reproducibility} 
Los algoritmos han sido implementados en Java (OpenJDK 17) con la biblioteca Tetrad 7.6.5\footnote{\url{https://github.com/cmu-phil/tetrad/releases/tag/v7.6.5}}. El código, RBs y conjuntos de datos están disponibles en GitHub\footnote{\url{https://github.com/ptorrijos99/BayesFL}}. Los datos, además, también están disponibles en OpenML\footnote{\url{https://www.openml.org/search?type=data&tags.tag=bnlearn}}. Los experimentos se han ejecutado en Rocky Linux 8.9 con procesadores AMD EPYC 7453, usando siete hilos y 8 GB de RAM por ejecución.

%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% 
\subsection{Metodología} \label{subsec:exp_methodology} 
Escalamos el trabajo de \cite{Torrijos2024_CEC} evaluando RBs más grandes ($n = \{10, 30, 50\}$ en las sintéticas y desde 20 hasta 56 en las reales), y con un mayor número de DAGs de entrada ($r = \{10, 30, 50\}$). Evaluamos la fusión con dos métricas (Sección \ref{subsec:preliminaries_metrics}): SMHD y \textsc{FSim} promedio respecto a los DAGs originales, denotadas como $m = \{\textsc{SMHD}_{\mathbb{G}}, \textsc{FSim}_{\mathbb{G}}\}$. Para cada DAG base $\mathcal{G}_0$, generamos diez conjuntos de DAGs de entrada $\mathbb{G}^i = \{\mathcal{G}_1^i, \dots, \mathcal{G}_r^i\}$ utilizando distintas semillas aleatorias. Para cada combinación $(i, r, n, m, tw)$, con $tw \in \{t \mid 2 \leq t < \text{tw}(\mathcal{G}^+)\}$, ejecutamos cada algoritmo genético y su correspondiente voraz descritos en la Sección \ref{subsec:algorithms}. Los algoritmos genéticos emplean un tamaño de población de 100, en línea con la configuración óptima identificada en \cite{Torrijos2024_CEC}.


%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
\subsection{Resultados para RBs sintéticas} \label{subsec:results_synthetic_BNs}
Se han realizado dos ejecuciones independientes de los algoritmos genéticos, una optimizando \SMHD~y otra \FSim. Las Figs. \ref{fig:synthetic_SMHD_original} y \ref{fig:synthetic_FSim_original} resumen los resultados para cada métrica, mostrando el desempeño promedio bajo diferentes restricciones de \textit{treewidth}, así como el rango de \textit{treewidths} ${\text{tw}(\mathbb{G})}_{min}^{max}$ y el \textit{treewidth} promedio $\overline{\text{tw}(\mathbb{G})}$ de los grafos de entrada. La Tabla \ref{tab:synthetic_results} proporciona un resumen detallado, incluyendo la diferencia media entre el algoritmo con mejor desempeño y los demás ($\overline{\textsc{Dif}}$), el número de veces que cada algoritmo alcanzó el mejor rendimiento, incluyendo empates (\textsc{\#Mejor}), y el tiempo promedio de ejecución ($\overline{\textsc{Tiempo (s)}}$). Como referencia, el método de fusión sin restricciones $\mathcal{G}^+$ presenta una diferencia media de 211.5 en \SMHD~y 98.9 en \FSim~respecto al mejor algoritmo en todos los conjuntos de datos. A partir de estos resultados, extraemos las siguientes conclusiones:

\begin{figure}[htbp]
  \centering
  \begin{minipage}{0.5\textwidth}
    \centering
    \includegraphics[width=\linewidth]{figures/SMHD(orig)_vs_TW.pdf}%
    \caption{\SMHD~en RBs sintéticas.}%
    \label{fig:synthetic_SMHD_original}
  \end{minipage}%
  \begin{minipage}{0.5\textwidth}
    \centering
    \includegraphics[width=\linewidth]{figures/FusSim_vs_TW.pdf}%
    \caption{\FSim~en RBs sintéticas.}%
    \label{fig:synthetic_FSim_original}
  \end{minipage}
\end{figure}
%
\begin{figure}[htbp]
  \begin{minipage}{0.56\textwidth}
    % SMHD original and FSim (table) (synthetic RBs)
    \begin{table}[H]
      \caption{Resultados en RBs sintéticas.}
      \label{tab:synthetic_results}
      \resizebox{\textwidth}{!} {%
        \begin{tabular*}{1.53\textwidth}{@{\extracolsep{\fill}}@{\hspace{0.1em}}l@{\hspace{0.5em}}l@{\hspace{0.5em}}S[table-format=3.1]@{\hspace{0.5em}}S[table-format=3.0]@{\hspace{0.5em}}S[table-format=3.1]@{\hspace{0.5em}}S[table-format=2.1]@{\hspace{0.5em}}S[table-format=3.0]@{\hspace{0.5em}}S[table-format=4.1]@{\extracolsep{\fill}}@{\hspace{0.1em}}}
          \toprule
          \multicolumn{2}{c}{\multirowcell{2}{\textsc{\bfseries Algoritmo}}} & \multicolumn{3}{c}{\textsc{\bfseries SMHD$_\mathbb{G}$}} & \multicolumn{3}{c}{\textsc{\bfseries FSim$_\mathbb{G}$}} \\
          \cmidrule(r){3-5}\cmidrule(){6-8}
          & & $\overline{\textsc{Dif}}$ & \textsc{\#Mejor} & $\overline{\textsc{Tiempo (s)}}$ & $\overline{\textsc{Dif}}$ & \textsc{\#Mejor} & $\overline{\textsc{Tiempo (s)}}$ \\
          \midrule
          \multirowcell{3}{\rotatebox[origin=c]{90}{\textsc{Voraz}}} 
            & \Ea~ \cite{Torrijos2024_CEC} & 85.8 & 0 & \B 0.1 & 39.7 & 0 & \B 0.1 \\
            & \Ec~ (Alg. \ref{alg:greedy}) & 114.5 & 0 & 127.8 & 62.7 & 0 & 274.6 \\
            & \Eb~ (Alg. \ref{alg:greedy}) & 73.0 & 1 & 8.5 & 30.9 & 1 & 14.3 \\
          \cmidrule(){1-2}\cmidrule(r){3-5}\cmidrule(){6-8}
          \multirowcell{3}{\rotatebox[origin=c]{90}{\textsc{Genét.}}} 
            & \Ea~ \cite{Torrijos2024_CEC} & 12.6 & 27 & 4.1 & 5.4 & 30 & 1785.9 \\
            & \Ec~ (Alg. \ref{alg:genetic}) & 15.1 & \B 95 & 250.0 & 9.5 & \B 91 & 2386.2 \\
            & \Eb~ (Alg. \ref{alg:genetic}) & \B 3.5 & \B 95 & 50.5 & \B 1.4 & 90 & 1790.5 \\
          \midrule
        \end{tabular*}
      }
    \end{table}
  \end{minipage}%
  \hspace{0.01\textwidth}
  \begin{minipage}{0.42\textwidth}
    % SMHD original and FSim (table) (real BNs)
    \begin{table}[H]
      \caption{Resultados en RBs reales.}
      \label{tab:real_results}
      \resizebox{\textwidth}{!} {%
        \begin{tabular*}{1.53\textwidth}{@{\extracolsep{\fill}}@{\hspace{0.1em}}S[table-format=3.1]@{\hspace{0.5em}}S[table-format=3.0]@{\hspace{0.5em}}S[table-format=3.1]@{\hspace{0.5em}}S[table-format=2.1]@{\hspace{0.5em}}S[table-format=3.0]@{\hspace{0.5em}}S[table-format=4.1]@{\extracolsep{\fill}}@{\hspace{0.1em}}}
          \toprule
          \multicolumn{3}{c}{\textsc{\bfseries SMHD$_\mathbb{G}$}} & \multicolumn{3}{c}{\textsc{\bfseries FSim$_\mathbb{G}$}} \\
          \cmidrule(r){1-3}\cmidrule(){4-6}
          $\overline{\textsc{Dif}}$ & \textsc{\#Mejor} & $\overline{\textsc{Tiempo (s)}}$ & $\overline{\textsc{Dif}}$ & \textsc{\#Mejor} & $\overline{\textsc{Tiempo (s)}}$ \\
          \midrule
          179.5 & 0 & \B 0.2 & 71.1 & 0 & \B 0.2 \\
          192.3 & 0 & 167.5 & 96.5 & 0 & 128.2 \\
          160.4 & 2 & 18.4 & 51.5 & 1 & 13.0 \\
          \cmidrule(r){1-3}\cmidrule(){4-6}
          22.5 & 27 & 9.2 & 11.2 & 30 & 1703.0 \\
          \B 9.3 & \B 379 & 397.1 & 7.2 & \B 278 & 1970.5 \\
          12.6 & 176 & 160.8 & \B 4.0 & 178 & 1596.1 \\
          \midrule
        \end{tabular*}
      }
    \end{table}
  \end{minipage}
\end{figure}

\paragraph{Alg. \ref{alg:genetic} vs. \cite{Torrijos2024_CEC}} El Algoritmo \ref{alg:genetic} sin repetición (\Eb) obtiene los mejores resultados en todas las configuraciones, con gran estabilidad en \SMHD~y \FSim, aunque con tiempos de ejecución algo mayores que el algoritmo genético de \cite{Torrijos2024_CEC}. Por otro lado, el Algoritmo \ref{alg:genetic} con repetición de enlaces (\Ec) sobresale en límites de \textit{treewidth} más altos, pero presenta dificultades con los más pequeños.

\paragraph{Algoritmos Voraces} El Algoritmo voraz \ref{alg:greedy} con repetición de enlaces (\Ec) tiene un rendimiento deficiente debido al mayor espacio de búsqueda, lo que afecta también al algoritmo genético correspondiente. Sin embargo, los algoritmos genéticos consiguen mitigar estas limitaciones.

\paragraph{\SMHD~vs. \FSim} Los resultados para \SMHD~y \FSim~están altamente correlacionados, con diferencias principalmente en los tiempos de ejecución. \FSim~es más costoso computacionalmente debido a la necesidad de un número elevado de fusiones en cada iteración para evaluar cada \textit{fitness}.


%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
\subsection{Resumen de resultados en RBs reales} \label{subsec:results_real_BNs}
%Esta sección evalúa los algoritmos en RBs reales, tanto en precisión estructural (\SMHD, \FSim) como en estimación paramétrica.

%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%\subsubsection{Precisión estructural del modelo generado}
La Tabla \ref{tab:real_results} resume la precisión estructural media y el tiempo de ejecución de los modelos generados para las RBs reales. Las métricas son las mismas que las usadas anteriormente en la Tabla \ref{tab:synthetic_results}. Las conclusiones son similares a las de las redes sintéticas. El Algoritmo \ref{alg:genetic} con repetición de enlaces (\Ec) logra mejores soluciones al permitir mayor flexibilidad en la selección de arcos, pero a costa de un mayor tiempo de ejecución. Lidera en la diferencia media respecto a la mejor solución y tiene más victorias en \SMHD. Para \FSim, aunque lidera en victorias, es superado ligeramente por el algoritmo sin repeticiones (\Eb). Ambos algoritmos genéticos superan a \cite{Torrijos2024_CEC}, que, aunque más rápido en \SMHD, obtiene peores resultados en calidad de solución. La brecha entre algoritmos voraces y genéticos es aún mayor, destacando la robustez de los métodos propuestos.


\begin{comment}
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
\subsubsection{Estimación paramétrica en el modelo generado} 
Esta sección evalúa la capacidad de aprendizaje paramétrico de las RBs generadas, utilizando el tiempo promedio de aprendizaje ($\overline{\textsc{Tiempo}^*}$), el error absoluto medio ($\overline{\textsc{Err Abs}^*}$) respecto a las probabilidades marginales del \textit{gold-standard}, y la frecuencia de fallos en el aprendizaje paramétrico ($\textsc{\#NaN}$). Un fallo se cuenta si cualquier semilla utilizada para una instancia genera un fallo, independientemente de cuántas fallen; el valor máximo para $\textsc{\#NaN}$ es 551. Los resultados, resumidos en la Tabla \ref{tab:real_inference}, se contextualizan comparándolos con la estimación paramétrica en $\mathcal{G}^+$ y el promedio de las redes de entrada $\overline{\mathbb{G}}$.

% Parametric Tiempo and NaNs (table) (real BNs)
\begin{table}[htbp]
  \caption{Resumen de resultados de la estimación paramétrica en las RBs reales.}
  \label{tab:real_inference}
  \resizebox{\columnwidth}{!} {%
    \begin{tabular*}{1.2\columnwidth}{@{\extracolsep{\fill}}@{\hspace{0.1em}}l@{\hspace{0.5em}}l@{\hspace{0.5em}}S[table-format=3.2]@{\hspace{0.5em}}S[table-format=1.4]@{\hspace{0.5em}}S[table-format=3.0]@{\hspace{0.5em}}S[table-format=3.2]@{\hspace{0.5em}}S[table-format=1.4]@{\hspace{0.5em}}S[table-format=3.0]@{\extracolsep{\fill}}@{\hspace{0.1em}}}
      \toprule
      \multicolumn{2}{c}{\multirowcell{2}{\textsc{\bfseries Algoritmo}}} & \multicolumn{3}{c}{\textsc{\bfseries SMHD$_\mathbb{G}$}} & \multicolumn{3}{c}{\textsc{\bfseries FSim$_\mathbb{G}$}} \\
      \cmidrule(r){3-5}\cmidrule(){6-8}
      & & $\overline{\textsc{Tiempo}^*}$ & $\overline{\textsc{Err Abs}^*}$ & $\textsc{\#NaN}$ & $\overline{\textsc{Tiempo}^*}$ & $\overline{\textsc{Err Abs}^*}$ & $\textsc{\#NaN}$ \\
      \midrule
      \multirowcell{3}{\rotatebox[origin=c]{90}{\textsc{Voraz}}} 
      & \Ea~ \cite{Torrijos2024_CEC} & 19.05 & 0.0485 & 146 & 23.23 & 0.0497 & 56 \\
      & \Ec~ (Alg. \ref{alg:greedy}) & 22.17 & 0.0498 & 116 & 26.05 & 0.0515 & 58 \\
      & \Eb~ (Alg. \ref{alg:greedy}) & 18.01 & 0.0466 & 123 & 17.99 & 0.0478 & 43 \\
      \cmidrule(){1-2}\cmidrule(r){3-5}\cmidrule(){6-8}
      \multirowcell{3}{\rotatebox[origin=c]{90}{\textsc{Genét.}}} 
      & \Ea~ \cite{Torrijos2024_CEC} & 1.02 & 0.0421 & 7 & 1.05 & 0.0417 & 2 \\
      & \Ec~ (Alg. \ref{alg:genetic}) & \B 0.93 & 0.0406 & 7 & 0.98 & 0.0414 & 2 \\
      & \Eb~ (Alg. \ref{alg:genetic}) & 1.02 & 0.0412 & 4 & \B 0.95 & 0.0410 & 2 \\
      \cmidrule(){1-2}\cmidrule(r){3-5}\cmidrule(){6-8}
      & $\overline{\mathbb{G}}$ & 1.32 & \B 0.0381 & \B 0 & 2.09 & \B 0.0385 & \B 0 \\
      & $\mathcal{G}^+$ & 112.84 & 0.0554 & 280 & 145.03 & 0.0568 & 280 \\
      \midrule
    \end{tabular*}
  }
\end{table}

Los resultados cumplen con las expectativas. Los fallos en la estimación de las distribuciones de probabilidad condicional ($\textsc{\#NaN}$) crecen exponencialmente para los algoritmos que producen redes más densas. Los grafos originales $\overline{\mathbb{G}}$ logran el menor error, mientras que la fusión sin restricciones $\mathcal{G}^+$ muestra el mayor error. Los algoritmos voraces tienen un rendimiento deficiente, aproximándose a la fusión sin restricciones, mientras que los algoritmos genéticos producen resultados más cercanos a las RBs originales, alineados con su objetivo de optimización. 

En la mayoría de los casos, los algoritmos genéticos generan redes de complejidad comparable o más simples que las originales, con tiempos de ejecución reducidos. Ocasionalmente ocurren fallos, aunque significativamente menos que con los algoritmos voraces, debido a limitaciones de memoria cuando la restricción de \textit{treewidth} se acerca a la de la fusión sin restricciones, debido al crecimiento exponencial de la complejidad en el aprendizaje paramétrico. Ambas versiones del Algoritmo \ref{alg:genetic} superan al algoritmo genético de \cite{Torrijos2024_CEC}, con diferencias mínimas entre los entrenados utilizando \SMHD~o \FSim~como función de optimización.

\end{comment}




%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%
%                                CONCLUSIONS
%
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
\section{Conclusiones} \label{sec:conclusion}
Este estudio propone un nuevo marco para la fusión de RBs, redefiniendo la tarea como alcanzar un consenso estructural bajo una restricción de treewidth. Los métodos tradicionales \cite{Puerta2021Fusion} tienden a generar redes excesivamente complejas, mientras que los enfoques restringidos \cite{Torrijos2024_CEC} pueden sobreajustarse al ruido de entrada. Nuestro enfoque basado en consenso aborda estos problemas al centrarse en las estructuras compartidas y minimizar la divergencia entre la red fusionada y las RBs de entrada. Para resolver este problema, diseñamos dos algoritmos genéticos especializados con estrategias de inicialización, operadores genéticos específicos para el problema y una función de \textit{fitness} que equilibra la similitud estructural con las restricciones de treewidth. Además, introdujimos métricas para evaluar la calidad del consenso mientras controlamos la complejidad de las RBs.

Los resultados experimentales en redes sintéticas y reales muestran que los algoritmos genéticos propuestos superan a los métodos previos \cite{Torrijos2024_CEC}, destacando los beneficios de podar enlaces antes de la fusión. El algoritmo que permite repeticiones de enlaces, aunque menos estable, a menudo obtiene los mejores resultados. En conclusión, los algoritmos genéticos propuestos son una solución robusta y flexible para el consenso restringido de RBs, con posibles mejoras en heurísticas voraces de inicialización, estrategias de optimización y aplicaciones en aprendizaje federado y otros dominios.



\acksection
Este trabajo está financiado por: TED2021-131291B-I00, PID2022-139293NB-C32 and FPU21/01074 (MICIU/AEI/10.13039/501100011033 and Unión Europea NextGenerationEU/PRTR), SBPLY/21/180225/000062 (Junta de Comunidades de Castilla-La Mancha y ERDF, UE) y 2022-GRIN-34437 (Universidad de Castilla-La Mancha y ERDF, UE).


\bibliographystyle{plain}
\bibliography{biblio}

\end{document}