Nodos más influyentes en un grafo con networkx. Parte 4.

Posted on dom 11 agosto 2013 in Tutorial Python • 2 min read

En la parte 3 de creación de grafos se muestra los tipos de grafos que existen, en la parte 2 se muestra como obtener los datos de un archivo que contiene las relaciones de los personajes de la novela Los miserables y en la parte 1 se muestra la creación de grafos.

En este artículo se toma el archivo de la parte 2 para obtener los nodos del grafo más influyentes, los que más se enlazan con otros personajes de la novela.

Este artículo se basa en el artículo en Inglés Betweenness Centrality.

Se usará la librería networkx para tomar la información del archivo lesmiserables.gml , para obtener los nodos más influyentes se usará la centralidad por intermediación.

La centralidad por intermediación se centra en el número de visitas a través de los caminos más cortos.

La centralidad por intermediación se define como:

Donde s(s,t) es el número total de rutas más cortas desde el nodo s al nodo t, y sv(s,t) es el número de los camions que pasan a través de v.

A continuación se muestra el código python que permite calcular los nodos más influyentes por medio de la centralidad por intermediación:

#!/usr/bin/env python

import networkx as nx

from pylab import show, hist, figure

#Leer los datos del archivo lesmiserables.gml

G = nx.read_gml('lesmiserables.gml',relabel=True)

#Funcion que devuelve los nodos mas importantes

def most_important(G):

 """ retorna una copia de G con los nodos mas importantes(mas influencia, conexion entre nodos) """ 

    #Se calcula el ranking segun la centralidad

    ranking = nx.betweenness_centrality(G).items(

    #Se imprime los nodos mas importantes

    print ranking

    r = [x[1] for x in ranking]

    m = sum(r)/len(r) # centralidad

    t = m*3 # se mantiene los nodos  con promedio de aparicion de 3 veces


    Gt = G.copy()


    #Se remueve los nodos que no aparecen


    for k, v in ranking:


        if v < t:


            Gt.remove_node(k)


    #Se retorna los nodos mas importantes


    return Gt

#Se recibe los nodos mas importantes


Gt = most_important(G) # trimming

# se crea el layout


pos = nx.spring_layout(G)


#Se dibuja los nodos y sus bordes


nx.draw_networkx_nodes(G,pos,node_color='b',alpha=0.2,node_size=8)


nx.draw_networkx_edges(G,pos,alpha=0.1)

#Se dibuja los nodos mas importantes con un estilo diferente


nx.draw_networkx_nodes(Gt,pos,node_color='r',alpha=0.4,node_size=254)


# se define las etiquetas


nx.draw_networkx_labels(Gt,pos,font_size=12,font_color='b')


#Se muestra la grafica


show()

La gráfica donde se ve los personajes más influyentes en la novela Los miserables se muestra a continuación:

Esto es útil a la hora de manejar la influencia en redes sociales como twitter.

¡Haz tu donativo! Si te gustó el artículo puedes realizar un donativo con Bitcoin (BTC) usando la billetera digital de tu preferencia a la siguiente dirección: 17MtNybhdkA9GV3UNS6BTwPcuhjXoPrSzV

O Escaneando el código QR desde la billetera:

17MtNybhdkA9GV3UNS6BTwPcuhjXoPrSzV

Share on: Twitter Facebook LinkedIn Email