Ke!640 – De cómo la belleza vence a la edad, y Microsoft es un condensado de Bose-Einstein

Ke!640 – De cómo la belleza vence a la edad, y Microsoft es un condensado de Bose-Einstein

Lo que aplicamos a un campo (como por ejemplo, el estudio del Web) puede aplicarse a otros campos científicamente distantes. Del análisis de decenas de organismos vivos, se ha llegado a la conclusión que en todo tipo de células hay unas pocas moléculas involucradas en la mayoría de reacciones (son, pues, los nodos principales, de la red). Más aún, «en la gran mayoría de organismos, el trifosfato de adenosina (ATP) es la molécula con más enlaces (o sea, que participa en el mayor número de reacciones), seguida de cerca por el difosfato de adenosina (ADP).

El estudio del Web, de la economía, del cáncer o del comportamiento sociológico de la gente podrá mejorar gracias a una ciencia que utilice el concepto de red, nodo y conexión como elementos fundamentales de análisis.

(Tiempo estimado de lectura: 9 minutos)

PARA PENSAR:

Si algo tengo claro en estos momentos es que para aprender es imprescindible mirar en diversas direcciones. Campos de conocimiento aparentemente distantes muestran sinergias muy considerables. Cuando los objetos de análisis de disciplinas aparentemente distantes se miran “en abstracto”, “desde arriba”, intentando encontrar los elementos fundamentales de su estructura y de su dinámica, descubrimos similitudes extraordinarias.

Un libro fascinante que me ha abducido durante el pasado mes de agosto me lo ha demostrado una vez más.

Se trata de Linked: the new science of networks de A.L. Barabási ( http://www.amazon.com/exec/obidos/tg/detail/-/0738206679/infonomia), del que hablamos brevemente en un mensaje anterior ( http://www.instituteofnext.com/extranet/index.asp?idm=1&idrev=1&num=636).

En este texto, este físico nos enseña como “leyes naturales sorprendentemente simples, pero de gran calado, gobiernan la estructura y evolución de todas las redes complejas que nos rodean”. Como consecuencia, deriva que el estudio de la estructura y, mejor, del comportamiento (dinámica) de las redes “dominará la investigación científica de este siglo”. O sea, si una ciencia es ahora necesaria es una “ciencia de las redes” (en abstracto, multidisciplinar).

El estudio del Web, de la economía, del cáncer o del comportamiento sociológico de la gente podrá mejorar gracias a una ciencia que utilice el concepto de red, nodo y conexión como elementos fundamentales de análisis.

El texto es muy rico en matices. Voy a concentrarme aquí en explicar como Barabási explica porque el Web es hoy como es…

La idea de Paul Baran

Como es bien sabido (forma parte de la leyenda de Internet), a principios de los sesenta un investigador de Rand recibió el encargo de “pensar un sistema de comunicaciones que pudiera sobrevivir a un ataque nuclear”.

Paul Baran llego a la conclusión que las posibles “topologías” (formas) de tal red podían ser solo tres:

· Centralizada: un gran nodo central desde el que salen todas las conexiones.
· Descentralizada: varios nodos importantes desde los que salen las conexiones.
· Distribuida: ningún nodo es más importante que los otros.

Las topologías de red de Baran: centralizada, descentralizada y distribuida

Y concluyo que sólo la última, la distribuida, garantizaba la supervivencia en caso de ataque. Esta estructura era lo suficientemente “redundante” como para que, si algunos nodos caían, los otros mantuvieran la utilidad de la red (se podían encontrar rutas alternativas entre dos puntos cualquiera de la misma).

Pues bien, la realidad es que Internet no se parece en nada hoy a esta estructura distribuida. Internet es una red en la que hay unos nodos más importantes que otros. De hecho, que existan unos cuantos nodos que son realmente críticos hace a la red extremadamente vulnerable: unos cuantos “crakers” bien entrenados podrían inutilizar Internet en unos minutos, si supieran que pequeñas decenas de nodos importantes tienen que atacar y desactivar.

¿Cómo es que Internet ha pasado de ser una red “distribuida” a una red con nodos más importantes?

Los ricos se hacen más ricos

Barabási nos explica como en su grupo de investigación empezaron a analizar la Web con el fin de determinar su estructura. El resultado de su investigación es que la gran mayoría de páginas en el Web tiene muy pocos enlaces que llevan a ellas, mientras unas pocas páginas “reciben” millones de enlaces. O sea, el Web está “dominado” por unas pocas páginas muy enlazadas (grandes portales, etc).

La distribución de las páginas web, en términos del número de enlaces que estas tienen, sigue una distribución tipo Pareto: la gran mayoría de páginas tienen pocos enlaces, y unas pocas páginas (los nodos principales) reciben un gran número de enlaces (o sea, son “referenciadas” desde miles de otras páginas).

¿Cómo nacen esos nodos principales?

El mecanismo que Barabási propone es muy simple (véase gráfico inferior).

Muchas redes complejas, como el Web, muestran un comportamiento regulado por dos parámetros esenciales, denominados crecimiento (growth) y enlace preferencial (preferential attachment).

Imaginemos una red que empieza con dos nodos. Su opción es conectarse entre sí.

En rojo, los nodos que van incorporándose a la red. Al final, quedan dos nodos con más conexiones. Son los nodos principales (en verde).

Añadimos un nuevo nodo. Imaginemos que todo nodo de esta red debe conectarse a, por lo menos, otros dos nodos. El resultado es la segunda viñeta del grafico anterior.

Añadamos un tercer nodo. A que nodos se conectará. Pues bien, la mayoría de redes complejas existentes en la naturaleza parecen comportarse de manera que los nodos “prefieren” conectarse a los nodos que tengan un mayor número de conexiones (véase como ocurre esto en la tercera viñeta, así como en las que siguen).

El resultado es que los nodos más “ricos” en enlaces se hacen cada vez más ricos (el fenómeno “dinero llama a dinero”, o rich get richer).

Según este esquema, al cabo del tiempo aparecen unos cuantos nodos con gran número de conexiones, otros con menos, y otros con menos, etc. El resultado es una red donde la distribución de enlaces sigue la ley de Pareto (una ley de potencia).

La distribución de páginas en el Web de acuerdo con el número de enlaces que llevan a ellas. Aparecen unos pocos nodos con muchos enlaces, entre muchos nodos con unos pocos enlaces.

Y la razón principal de que algunos nodos tengan más enlaces (o sea, sean más ricos), es que llevan básicamente mas tiempo. O sea, la “veteranía” es, en una red compleja, una razón de éxito (simplemente, porque el mayor tiempo en la red les ha dado más oportunidades de capturar más enlaces).

El problema es, si esto es cierto, si la veteranía de las páginas web es un grado, ¿por qué webs como Google, que no proceden del “origen de los tiempos” de Internet, han acabado teniendo el éxito que han tenido? ¿Cómo es que se han constituido en nodos principales de la Red?

La competencia también existe en las redes

El modelo de Barabási se completa con un parámetro obvio: la competencia. En el mundo real (no en el matemático), existe competencia en las redes. Los nodos compiten por enlaces. En un entorno competitivo, como el real, los nodos tienen una determinada capacidad (fitness) de atraer enlaces.

Así, por ejemplo, en el Web esa capacidad de atracción puede ser la originalidad de los contenidos. En la red del “mercado”, esa capacidad es la calidad del producto/servicio, o la visibilidad de marca.

En definitiva, en las redes reales los nodos captan enlaces debido a su capacidad de atracción. Así, en una red los nodos prefieren enlazarse con nodos que no solo tienen muchos enlaces sino que además tienen más atractivo. La preferencia de enlace a un nodo es el “producto” del número de enlaces que ya tiene y de su atractividad (fitness).

Barabási lo resume de una manera elegante: en las redes reales la “belleza” vence sobre la “edad”. Los nodos que acaban teniendo más enlaces no son los que llevan más tiempo (veteranía) sino los que son mas atractivos (fitness). Lo que significa “atractivo” depende del caso: puede ser la calidad de los contenidos, el valor del servicio, el prestigio de marca, etc, como ya hemos comentado más arriba.

En el texto se explica que hay un caso concreto de red en el que más que estar en una situación en la que “los ricos se hacen más ricos” (rich get richer), hay “uno solo que se queda con todo” (winner takes all).

Más aún, se explica que, en una analogía sutil con la mecánica cuántica, ese estado correspondería a una “condensación de Bose-Einstein» de la red, en la que todos los enlaces están en un mismo “estado”, o sea conectados a un único nodo. Barabási señala que hoy sólo conocemos un ejemplo de tal red “en estrella”: la red del mercado de sistemas operativos, en el que los nodos son los sistemas operativos y los enlaces son los usuarios de los mismos. En esta red todos los enlaces conectan a un sólo nodo: Microsoft. Así, curiosamente, Microsoft sería un caso de condensado Bose-Einstein en el mercado de sistemas operativos.

Es en este punto donde entendemos la potencia de una “sintaxis” generalista sobre redes. Lo que aplicamos a un campo (como por ejemplo, el estudio del Web) puede aplicarse a otros campos científicamente distantes.

Por ejemplo, Barabási nos avisa de por qué la medicina (o la biología) deberá en el futuro entender muy bien el “mecanismo de redes” de los sistemas vivos. Así, del análisis de decenas de organismos vivos, su grupo ha llegado a la conclusión que en todo tipo de células hay unas pocas moléculas involucradas en la mayoría de reacciones (son, pues, los nodos principales, de la red). Más aún, señala que “en la gran mayoría de organismos, el trifosfato de adenosina (ATP) es la molécula con más enlaces (o sea, que participa en el mayor número de reacciones), seguida de cerca por el difosfato de adenosina (ADP).

Finalmente, el Web es una pajarita

Hemos aprendido pues, que Internet ha evolucionado desde una red distribuida (todos los nodos deberían ser iguales, sugería Baran) hacia una red à la Pareto (unos pocos nodos tienen un gran número de enlaces).

En la terminología de Barabási, el Web es una “red libre de escala” (scale-free network). Como lo son, según las investigaciones de su grupo, la mayoría de redes complejas del mundo real.

Una red libre de escala es aquella es la que hay unos nodos más importantes que otros. Además del Web, otro ejemplo real de este tipo de red seria la red del sistema de trafico aéreo comercial, en especial en los Estados Unidos: hay unos cuantos grandes nodos (hubs) por donde pasa la gran parte del trafico.

Este tipo de red presenta un problema importante: es muy vulnerable. Atacando un número crítico de nodos principales (hubs) se puede desactivar una red.

La concentración de tráfico en unos cuantos nodos principales es el “tendón de Aquiles” de redes como el Web. Ataca unos cuantos routers críticos de Internet y conseguirás hundirla, nos dice el autor.

Como red, el Web presenta un último problema. Los enlaces son «unidireccionales». Los enlaces (links) van de una página a otra, y no al revés. Esta es una diferencia notable del Web frente a otras redes como la de tráfico aéreo (un avión puede ir de un hub a otro, y también en el sentido contrario).

Esta “unidirecionalidad” del Web (“directedness”) tiene importantes consecuencias. La más importante es que hay una parte ingente del Web que es invisible…

Más exactamente, el Web presenta una topología en forma de “pajarita”, como ya comentamos en su día enke! ( http://www.instituteofnext.com/extranet/index.asp?idm=1&idrev=1&num=511):

· En el Web hay un núcleo central de unos pocos nodos todos conectados entre sí («core»),
· Una parte («origination», lóbulo izquierdo del dibujo) cuyas páginas llevan al núcleo central.
· Una parte («termination», lóbulo derecho) a la que llevan las páginas del núcleo central.
· Otras partes conectadas con los lóbulos, en forma de cintas, que sólo se comunican con los webs que hay en el lóbulo en cuestión
· Y unas cuantas islas a las que ninguna de las otras partes enlaza («disconnected»).

El modelo «pajarita» del World Wide Web, según el estudio de IBM Research. http://www.almaden.ibm.com/almaden/webmap_press.html

Pues bien, la consecuencia de esta estructura en «continentes» del Web es que, si no consigues que algún nodo del núcleo central («core») te referencie, pocos usuarios te van a conocer. Peor aún, pocos robots de búsqueda te van a encontrar.

Así, la mayor parte de páginas web son, en realidad, “invisibles”.

En resumen, Barabási nos enseña que entender el mundo a partir de un “lenguaje científico de redes” puede ser de gran utilidad.

En concreto, el Web se ha convertido en una red con unos pocos grandes nodos principales, a causa del mecanismo de “enlace preferencial” (los webs prefieren conectarse a nodos ya muy conectados), de la “capacidad de atracción” específica (atractividad en una determinada cuestión, valor concreto para un colectivo), y de la “unidireccionalidad” de los enlaces (yo puedo poner un enlace a tu página, pero eso no significa que tu página corresponda al detalle…).

Y, ¿cómo afecta todo esta a la empresa en red? Lo veremos la próxima semana…

No Comments

Sorry, the comment form is closed at this time.