Webscraping o extracción de datos de páginas web con BeautifulSoup4 y Python

Posted on jue 24 octubre 2013 in Tutorial Python • Tagged with Canaima, Debian, General, Linux, Python, Ubuntu, webscraping, Beautiful Soup • 3 min read

El webscraping es una técnica utilizada para extraer datos de una página web por medio de herramientas (más información en wikipedia).

Para Python existen varias herramientas:


Continue reading

Una introducción a Beautiful Soup 4 en Python.

Posted on mié 23 octubre 2013 in Tutorial Python • Tagged with Canaima, Debian, General, Linux, Python, Ubuntu, Beautiful Soup, webscraping • 3 min read

Beautiful Soup es una librería de Python que facilita la extracción de datos de archivos html y xml.

Este artículo se basa en el artículo de Python For Beginners .

La documentación oficial se puede leer en el siguiente enlace.

Para instalar beautifulsoup es necesario tener instalado la librería python-bs4 el …


Continue reading

Obtener información de metadatos EXIF de una imagen con Python

Posted on lun 14 octubre 2013 in Tutorial Python • Tagged with Canaima, Debian, General, Linux, Python, Ubuntu, exif • 3 min read

Se probará con un simple script como obtener metadatos EXIF de dos imágenes, son dos fotos, la primera directamente del dispositivo móvil con que se tomó la foto, la segunda imagen se bajó desde Google+.

La idea es notar la diferencia de información que se obtiene de los metadatos de …


Continue reading

Mostrar tweets en tiempo real con twython y el API Stream de Twitter

Posted on jue 26 septiembre 2013 in Tutorial Python • Tagged with Debian, General, Linux, Python, Twitter, Ubuntu • 4 min read

En este artículo se usará el API Stream de twitter para ver el flujo de tweets que recibe el usuario o lo que se publica en general en twitter.

La idea es usar twython con la clase TwythonStreamer para acceder a la API stream de twitter.

Del API de twitter …


Continue reading

Probando la librería twython para twitter

Posted on dom 22 septiembre 2013 in Tutorial Python • Tagged with Canaima, Debian, General, Linux, Python, Twitter, Ubuntu • 4 min read

Retomando los artículos sobre librerías de python para acceder a twitter, en el último artículo explique como descubrir trending topic con la librería python-twitter, ahora le toca el turno a twython. La página del proyecto se encuentra en github.

Twython soporta lo siguiente:

  • Busqueda para:
    • Información de usuario.
    • Lista de …

Continue reading

Descubriendo Trending Topics de Twitter con twython y python

Posted on dom 22 septiembre 2013 in Tutorial Python • Tagged with Canaima, Debian, General, Linux, Python, Twitter, Ubuntu • 2 min read

Siguiendo con los artículos sobre librerías de python para twitter, hace poco se mostró en un artículo como ver los Trending Topics usando la librería python-twitter , ahora se mostrará como desplegar los topics usando la librería twython.

El script mostrará la conexión a twitter, luego despliega los identificadores de las …


Continue reading

Manejo de sesión en el ORM sqlalchemy

Posted on mié 18 septiembre 2013 in General • Tagged with General, Python • 3 min read

Hace tiempo explique como crear unas tablas para la base de datos sqlite3, insertar datos, removerlos y consultarlos,el artículo se llama Abstracción del motor de Base de Datos con el ORM Sqlalchemy y python.

Antes de comenzar a probar lo que se escribe en este artículo es necesario que …


Continue reading

Bajar vídeos de youtube desde Python con Pafy.

Posted on dom 01 septiembre 2013 in General • Tagged with General • 3 min read

Pafy permite realizar busquedas de vídeos de youtube y descargarlos.

El sitio de Pafy se encuentra en github, en ese sitio se puede bajar la librería en formato zip, tar.gz o visitar el repositorio git del proyecto.

Para instalar Pafy desde Linux se puede hacer con easy_install o pip …


Continue reading

Día Debian en Barquisimeto

Posted on vie 16 agosto 2013 in Evento • Tagged with Canaima, Debian, General, Ubuntu • 1 min read

Mañana sábado se realizará el evento Día Debian en El INCES de la carrera 19 con calle 23 desde las 9am en Barquisimeto.

La charla que llevaré se llama colaborar en Debian, la pueden descargar en slideshare.

Colaborar debian from Ernesto Crespo

¡Haz tu donativo! Si te gustó el artículo …


Continue reading

Nodos más influyentes en un grafo con networkx. Parte 4.

Posted on dom 11 agosto 2013 in Tutorial Python • Tagged with General, Networkx, Python • 2 min read

En la parte 3 de creación de grafos se muestra los tipos de grafos que existen, en la parte 2 se muestra como obtener los datos de un archivo que contiene las relaciones de los personajes de la novela Los miserables y en la parte 1 se muestra la creación …


Continue reading