News Release

Descifrando la dimensionalidad de las redes complejas mediante la geometría hiperbólica

Geometría hiperbólica versus euclidiana

Peer-Reviewed Publication

University of Barcelona

Redes complejas

image: El equipo infiere cúal es la dimensionalidad del espacio hiperbólico subyacente a las redes reales a partir de las propiedades que se relacionan con la dimensión de su geometría. view more 

Credit: UNIVERSIDAD DE BARCELONA / NATURE COMMUNICATIONS

Reducir información redundante para encontrar patrones simplificadores en conjuntos de datos y redes complejas es un reto científico en muchos ámbitos del conocimiento. Además, detectar la dimensionalidad de los datos aún es un problema de difícil resolución. Un artículo publicado en la revista Nature Communications presenta un método para inferir la dimensionalidad de las redes complejas mediante la aplicación de la geometría hiperbólica, que captura la complejidad de estructuras relacionales del mundo real en dominios muy diversos.

 

Son autores del trabajo los investigadores M. Ángeles Serrano y Marián Boguñá, de la Facultad de Física y del Instituto de Sistemas Complejos de la Universidad de Barcelona  (UBICS), y Pedro Almargo, de la Escuela Técnica Superior de Ingeniería Informática de la Universidad de Sevilla. La investigación aporta un modelo hiperbólico multidimensional de redes complejas que reproduce fielmente su conectividad, con una dimensionalidad ultra baja y personalizable para cada red concreta. Esto permite caracterizar mejor su estructura —por ejemplo, a escala de comunidades— y mejorar su capacidad predictiva.

El estudio revela regularidades inesperadas, como las dimensiones extremadamente bajas de redes moleculares asociadas a tejidos biológicos; la dimensionalidad ligeramente superior que exigen las redes sociales e Internet y el descubrimiento que los conectomas cerebrales están cerca de las tres dimensiones de su organización automática.

Geometría hiperbólica versus euclidiana

La geometría intrínseca de los conjuntos de datos o las redes complejas no es obvia, hecho que se convierte en un obstáculo para poder determinar la dimensionalidad de las redes reales. Otro desafío es que la definición de distancia se tiene que establecer de acuerdo con su estructura relacional y de conectividad, y esto requiere también modelos sofisticados.

Ahora, el nuevo enfoque tiene como referencia la geometría de las redes complejas, y más concretamente, el modelo geométrico configuracional o modelo SD. «Este modelo, que hemos desarrollado en trabajos anteriores, describe la estructura de las redes complejas basándose en principios fundamentales», detalla la profesora M. Ángeles, investigadora ICREA del Departamento de Física de la Materia Condensada de la UB.

«Más específicamente —continúa—, el modelo postula una ley de interconexión de los elementos de la red (o nódulos) que es de tipo gravitatorio, de manera que los nódulos más cercanos en un espacio de similitud —de geometría esférica en D dimensiones— y con más popularidad —una dimensión extra que corresponde a la importancia del nódulo— tienen más probabilidad de establecer conexiones

En el estudio, las variables de similitud y de popularidad se combinan para dar lugar a la geometría hiperbólica del modelo, que emerge como la geometría natural que representa la arquitectura jerárquica de las redes complejas.

En trabajos previos, el equipo había aplicado la versión más simple del modelo SD en una dimensión —el modelo S1— para explicar muchas características típicas de las redes del mundo real: la propiedad de mundo pequeño (los seis grados de separación), las distribuciones heterogéneas del número de vecinos por nódulos, y los altos niveles de relaciones transitivas (conexiones en triángulo que se pueden ilustrar con la frase el amigo de mi amigo también es mi amigo).

«Además, la aplicación de técnicas de inferencia estadística nos permite obtener mapas de redes reales en el plan hiperbólico que son congruentes con el modelo establecido», destaca la investigadora. «Más allá de la visualización, estas representaciones se han utilizado en multitud de tareas, que incluyen los métodos de navegación eficiente, la detección de patrones de autosemejanza, la detección de comunidades de nódulos fuertemente interactivos, y la implementación de un procedimiento de renormalización de redes que evidencia simetrías ocultas en la organización multiescalar de las redes complejas y permite la producción de réplicas de la red a escala reducida o aumentada».

Ahora, el equipo infiere cuál es la dimensionalidad del espacio hiperbólico subyacente a las redes reales a partir de las propiedades que se relacionan con la dimensión de su geometría. En particular, el trabajo mide la estadística de ciclos de orden superior (triángulos, cuadrados, pentágonos) asociados a las conexiones.

Una metodología aplicable a todas las redes complejas

En ciencias de la computación, las técnicas aplicadas se basan en datos que suelen hacer definiciones de distancia de similitud entre sus elementos, un enfoque que implica la construcción de grafos que se cartografían en un espacio latente de características euclidianas.

«Nuestras estimaciones de la dimensionalidad de las redes complejas están muy por debajo de nuestras estimaciones basadas en el espacio euclidiano, ya que el espacio hiperbólico más adecuado para representar la estructura jerárquica de redes complejas reales. Por ejemplo, Internet solo requiere D = 7 dimensiones para ser mapeado en el espacio hiperbólico de nuestro modelo, mientras que este nombre se multiplica por seis y escala a D = 47 en una de las técnicas más recientes que utilizan el espacio euclidiano», detalla el catedrático Marián Boguñá.

Además, las técnicas para mapear datos complejos suelen suponer un espacio latente, con un nombre predeterminado de dimensiones, o bien implementan técnicas heurísticas para encontrar un valor adecuado. Así, el nuevo método se basa en un modelo que no necesita el mapeado espacial de la red para determinar la dimensión de su geometría.

En el campo de la ciencia de redes, muchas metodologías utilizan las distancias más cortas para estudiar la estructura de conectividad de la red (shortest paths) como espacio métrico. Sin embargo, estas distancias se ven fuertemente afectadas para la propiedad de mundo pequeño y no proporcionan un rango amplio de valores de distancia.

«Nuestro modelo usa una definición de distancia completamente diferente y basada en un espacio hiperbólico subyacente, y no necesitamos mapear la red. Nuestra metodología es aplicable a cualquier red real o serie de datos con estructura compleja y con un tamaño que típicamente es de miles o decenas de miles de nódulos pero que puede llegar a centenares de miles en un tiempo razonable de computación», subraya M. Ángeles Serrano.

¿Cuál es la dimensionalidad real de las redes sociales e Internet?

La dimensión de las redes sociales y de Internet es más alta (entre 6 y 9) en comparación a redes de otros ámbitos, según las conclusiones del estudio. Sin embargo, aún es muy baja —6 o 7 veces menos— comparado con la obtenida por otros métodos. Esto refleja el hecho que las interacciones en estos sistemas son más complejos y están determinados por una mayor variedad de factores.

Por otro lado, las redes sociales basadas en amistad se encuentran al frente del ranking de dimensionalidad. «Es un resultado inesperado, ya que en principio se podría pensar que la amistad es un tipo de relación afectiva más libre, pero nuestros resultados ligan con el hecho que la homofilia en las interacciones humanas está determinada por una multitud de factores sociológicos como la edad, el sexo, la clase social, creencias, actitudes o intereses», apunta M. Ángeles Serrano.

En el caso de Internet, aun siendo una red tecnológica, su mayor dimensionalidad es un reflejo del hecho que para un sistema autónomo, conectarse no quiere decir solo acceder al sistema, como se podría pensar a priori. Por el contrario, son muchos los factores distintos que influyen en la formación de estas conexiones, y como consecuencia, otra variedad de las relaciones puede estar presente (por ejemplo, proveedor-cliente, peer-to-peer, peering basado en intercambio, etc.).

«Lo que es realmente sorprendente, tanto para las redes sociales como para Internet, es que nuestro marco teórico —que no usa ninguna anotación sobre las conexiones más allá de su existencia— sea capaz de captar esta realidad multidimensional que no es explícita en nuestros datos», concluye el equipo, que actualmente trabaja en la construcción de mapas multidimensionales hiperbólicos de las redes complejas que sean congruentes con el marco teórico establecido por el modelo SD.

 

 


Disclaimer: AAAS and EurekAlert! are not responsible for the accuracy of news releases posted to EurekAlert! by contributing institutions or for the use of any information through the EurekAlert system.