Crear entorno de desarrollo para Ciencia de Datos con Anaconda, Jupyter, git y cookiecutter

Posted on dom 28 julio 2019 in Tutorial de Data Science • Tagged with Debian, Ubuntu, Linux, Python, Data Science, Ciencia de Datos, Entorno Desarrollo • 5 min read

Entorno de desarrollo con anaconda, Jupyter, git, black y cookiecutter para Ciencia de datos


Continue reading

Validando un API rest asíncrono con Cerberus

Posted on sáb 08 junio 2019 in Tutorial de Python • Tagged with Debian, Python, aiohttp, Ubuntu, API rest, asincrono, Cerberus • 8 min read

Se creará un API rest asíncrono (usando aiohttp), donde se valida la entrada con cerberus


Continue reading

Cómo usar el API de wikipedia con Python

Posted on sáb 08 junio 2019 in Tutorial de Python • Tagged with Debian, Python, Wikipedia, Ubuntu • 10 min read

Uso de API de Wikipedia con Python


Continue reading

Visualizando estadisticas de pokemon usando plotly ( gráfica de radar)

Posted on sáb 01 diciembre 2018 in Tutorial Python • Tagged with Python, Matplotlib, Visualización, Plotly, Data Science, Ciencia de Datos, Kaggle, Pandas, Numpy • 4 min read

Luego de un tiempo sin escribir, retomo los artículos sobre Ciencia de Datos, ahora con visualización de datos. Para ello se usará la estadística de un repositorio de datos sobre los pokemon.

El gráfico radar es un gráfico que consiste en una secuencia de radios equi-angulares, llamados radios, y cada …


Continue reading

Analizando datos del cambio climático y niveles de CO2 en la atmosfera con Python y pandas.

Posted on dom 14 octubre 2018 in Tutorial Python • Tagged with Python, Kaggle, Pandas, Matplotlib, Seaborn, Cambio Climático, CO2, Data Science, Ciencia de Datos • 8 min read

Continuando con los artículos sobre ciencia de datos, esta vez se analizará datos sobre información del clima global y por países, así como los niveles de CO2.

Estos datos y proyecto los encontré en el sitio kaggle, este sitio es para publicar proyectos de ciencia de datos. Los datos para …


Continue reading

Generar gráficos animados de burbuja a lo Gapminer con Python

Posted on sáb 06 octubre 2018 in Tutorial Python • Tagged with Python, Matplotlib, Numpy, Pandas, Visualización, Data Science, Ciencia de Datos, Gapminer • 3 min read

En febrero de 2013 creé un artículo sobre Cómo hacer gráficos de burbujas con matplotlib, la idea era ver como se generaba una gráfica al estilo de la presentación de Hans Rosling (por cierto, murió en Febrero de 2017).

A continuación el vídeo que explica la historia de 200 países …


Continue reading

Contar palabras de un texto usando Spark con PySpark

Posted on mar 03 julio 2018 in Tutorial Python • Tagged with Python, Spark, PySpark • 5 min read

En el artículo anterior se explicó el procedimiento de instalación de Spark usando Docker. En este artículo se usará un texto tomado de la página de la ONU, de ahí se extrae las líneas y se cuentan las palabras.

A continuación el texto que se va a utilizar (lo pueden …


Continue reading

Como correr Apache Spark desde una imagen Docker

Posted on lun 02 julio 2018 in Tutorial Python • Tagged with Python, Spark, Docker, Big Data, Data Science, Ciencia de Datos • 3 min read

En este artículo se explicará la ejecución de Apache Spark usando un contenedor Docker, en vez de usar el procedimiento de instalación de Spark (instalar java, scala y spark).

Apache Spark proporciona una interfaz para la programación de clusters completos con paralelismos de Datos implicito y tolerancia a fallos. Tiene …


Continue reading

Visualización de Árbol de decisión

Posted on dom 17 junio 2018 in Tutorial Python • Tagged with Python, Machine Learning, Scikit-Learn, Árbol de decisión • 2 min read

Como en Noviembre del año pasado, escribí un artículo sobre árboles de decisión con Python, donde se tenía una serie de datos de entrada (altura, peso y talla) y de salida si era hombre o mujer. Para este artículo lo que se va a agregar es la visualización del árbol …


Continue reading

Análisis de Sentimiento de tweets con Python, TextBlob y tweepy

Posted on dom 10 junio 2018 in Tutorial Python • Tagged with Python, TextBlob, Tweepy, Análisis de Sentimiento, Twitter • 3 min read

Existe el área de análisis de redes sociales, puedes hacer gráficos de tendencias, lograr cual fue el origen de un tweet. La idea es usar la librería tweepy para conectase a Twitter y de allí capturar los tweets para luego realizar un análisis de sentimiento y graficar el resultado.

El …


Continue reading