Visualizando estadisticas de pokemon usando plotly ( gráfica de radar)

Posted on sáb 01 diciembre 2018 in Tutorial Python • Tagged with Python, Matplotlib, Visualización, Plotly, Data Science, Ciencia de Datos, Kaggle, Pandas, Numpy • 4 min read

Luego de un tiempo sin escribir, retomo los artículos sobre Ciencia de Datos, ahora con visualización de datos. Para ello se usará la estadística de un repositorio de datos sobre los pokemon.

El gráfico radar es un gráfico que consiste en una secuencia de radios equi-angulares, llamados radios, y cada …


Continue reading

Analizando datos del cambio climático y niveles de CO2 en la atmosfera con Python y pandas.

Posted on dom 14 octubre 2018 in Tutorial Python • Tagged with Python, Kaggle, Pandas, Matplotlib, Seaborn, Cambio Climático, CO2, Data Science, Ciencia de Datos • 8 min read

Continuando con los artículos sobre ciencia de datos, esta vez se analizará datos sobre información del clima global y por países, así como los niveles de CO2.

Estos datos y proyecto los encontré en el sitio kaggle, este sitio es para publicar proyectos de ciencia de datos. Los datos para …


Continue reading

Generar gráficos animados de burbuja a lo Gapminer con Python

Posted on sáb 06 octubre 2018 in Tutorial Python • Tagged with Python, Matplotlib, Numpy, Pandas, Visualización, Data Science, Ciencia de Datos, Gapminer • 3 min read

En febrero de 2013 creé un artículo sobre Cómo hacer gráficos de burbujas con matplotlib, la idea era ver como se generaba una gráfica al estilo de la presentación de Hans Rosling (por cierto, murió en Febrero de 2017).

A continuación el vídeo que explica la historia de 200 países …


Continue reading

Contar palabras de un texto usando Spark con PySpark

Posted on mar 03 julio 2018 in Tutorial Python • Tagged with Python, Spark, PySpark • 5 min read

En el artículo anterior se explicó el procedimiento de instalación de Spark usando Docker. En este artículo se usará un texto tomado de la página de la ONU, de ahí se extrae las líneas y se cuentan las palabras.

A continuación el texto que se va a utilizar (lo pueden …


Continue reading

Como correr Apache Spark desde una imagen Docker

Posted on lun 02 julio 2018 in Tutorial Python • Tagged with Python, Spark, Docker, Big Data, Data Science, Ciencia de Datos • 3 min read

En este artículo se explicará la ejecución de Apache Spark usando un contenedor Docker, en vez de usar el procedimiento de instalación de Spark (instalar java, scala y spark).

Apache Spark proporciona una interfaz para la programación de clusters completos con paralelismos de Datos implicito y tolerancia a fallos. Tiene …


Continue reading

Visualización de Árbol de decisión

Posted on dom 17 junio 2018 in Tutorial Python • Tagged with Python, Machine Learning, Scikit-Learn, Árbol de decisión • 2 min read

Como en Noviembre del año pasado, escribí un artículo sobre árboles de decisión con Python, donde se tenía una serie de datos de entrada (altura, peso y talla) y de salida si era hombre o mujer. Para este artículo lo que se va a agregar es la visualización del árbol …


Continue reading

Análisis de Sentimiento de tweets con Python, TextBlob y tweepy

Posted on dom 10 junio 2018 in Tutorial Python • Tagged with Python, TextBlob, Tweepy, Análisis de Sentimiento, Twitter • 3 min read

Existe el área de análisis de redes sociales, puedes hacer gráficos de tendencias, lograr cual fue el origen de un tweet. La idea es usar la librería tweepy para conectase a Twitter y de allí capturar los tweets para luego realizar un análisis de sentimiento y graficar el resultado.

El …


Continue reading

Visualizando series de tiempo de precios del mercado con pandas y matplotlib

Posted on mié 06 junio 2018 in Tutorial Python • Tagged with Python, Pandas, Matplotlib, Series de Tiempo, Visualización • 2 min read

En este artículo la fuente de datos se usará la librería de Quandl directamente. La idea es obtener los precios de mercado de 3 Aerolineas (Delta con código DAL, Jet Blue con código JBLU y Southwest con código LUV). Se gráfica el historico de los precios de cierre, el volumen …


Continue reading

Como obtener datos Financieros de Quandl con Python y Pandas

Posted on vie 25 mayo 2018 in Tutorial Python • Tagged with Python, Matplotlib, Pandas, Quandl • 2 min read

La idea de este artículo es explicar de manera básica el uso de Pandas para obtener datos financieros, en este caso el valor de las divisas de Países como Argentina, Brasil, Chile, Mexico y Venezuela. Quandl es una plataforma financiera y económica de datos alternativos que sirve para inversores profesionales …


Continue reading

Algoritmo de Clasificación con scikit-learn

Posted on sáb 21 abril 2018 in Tutorial Python • Tagged with Python, Scikit-learn, Inteligencia Artificial, Machine Learning • 3 min read

Continuando con los artículos sobre Inteligencia Artificial con Python.

La serie de artículos sobre Scikit-Learn han sido:

  1. Árbol de decisión hecho con Python (esté tendrá una segunda parte).
  2. Una red neuronal para aprendizaje supervisado usando scikit-learn.
  3. Funciones de activación para un perceptron.

El ejercicio que se explicará será el de …


Continue reading