Crear entorno de desarrollo para Ciencia de Datos con Anaconda, Jupyter, git y cookiecutter

Posted on dom 28 julio 2019 in Tutorial de Data Science • Tagged with Debian, Ubuntu, Linux, Python, Data Science, Ciencia de Datos, Entorno Desarrollo • 5 min read

Entorno de desarrollo con anaconda, Jupyter, git, black y cookiecutter para Ciencia de datos


Continue reading

Visualizando estadisticas de pokemon usando plotly ( gráfica de radar)

Posted on sáb 01 diciembre 2018 in Tutorial Python • Tagged with Python, Matplotlib, Visualización, Plotly, Data Science, Ciencia de Datos, Kaggle, Pandas, Numpy • 4 min read

Luego de un tiempo sin escribir, retomo los artículos sobre Ciencia de Datos, ahora con visualización de datos. Para ello se usará la estadística de un repositorio de datos sobre los pokemon.

El gráfico radar es un gráfico que consiste en una secuencia de radios equi-angulares, llamados radios, y cada …


Continue reading

Analizando datos del cambio climático y niveles de CO2 en la atmosfera con Python y pandas.

Posted on dom 14 octubre 2018 in Tutorial Python • Tagged with Python, Kaggle, Pandas, Matplotlib, Seaborn, Cambio Climático, CO2, Data Science, Ciencia de Datos • 8 min read

Continuando con los artículos sobre ciencia de datos, esta vez se analizará datos sobre información del clima global y por países, así como los niveles de CO2.

Estos datos y proyecto los encontré en el sitio kaggle, este sitio es para publicar proyectos de ciencia de datos. Los datos para …


Continue reading

Generar gráficos animados de burbuja a lo Gapminer con Python

Posted on sáb 06 octubre 2018 in Tutorial Python • Tagged with Python, Matplotlib, Numpy, Pandas, Visualización, Data Science, Ciencia de Datos, Gapminer • 3 min read

En febrero de 2013 creé un artículo sobre Cómo hacer gráficos de burbujas con matplotlib, la idea era ver como se generaba una gráfica al estilo de la presentación de Hans Rosling (por cierto, murió en Febrero de 2017).

A continuación el vídeo que explica la historia de 200 países …


Continue reading

Como correr Apache Spark desde una imagen Docker

Posted on lun 02 julio 2018 in Tutorial Python • Tagged with Python, Spark, Docker, Big Data, Data Science, Ciencia de Datos • 3 min read

En este artículo se explicará la ejecución de Apache Spark usando un contenedor Docker, en vez de usar el procedimiento de instalación de Spark (instalar java, scala y spark).

Apache Spark proporciona una interfaz para la programación de clusters completos con paralelismos de Datos implicito y tolerancia a fallos. Tiene …


Continue reading

Introducción a Pandas

Posted on dom 07 enero 2018 in Tutorial Python • Tagged with Ciencia de Datos, Python, Pandas, Data Science • 1 min read

Pandas es una librería de python para analizar datos, permite multiples entrada de datos.

El artículo se basa en un artículo en inglés Building a neural network with python, y en un tutorial de pandas.

Para este tutorial se usará un conjunto de datos en formato csv sobre vinos (análisis …


Continue reading

Usar Anaconda desde un contenedor Docker.

Posted on sáb 26 marzo 2016 in Tutorial Python • Tagged with Python, Docker, Anaconda, Ingeniería de Datos, Ciencia de Datos, Dockerhub • 3 min read

Continuando con artículos relacionados con Docker. Está vez se mostrará como correr Anaconda desde una imagen Docker.

A continuación les dejo los artículos anteriores: 1. Instalar Docker en Debian Jessie

  1. Uso de Docker en Debian Jessie (parte 1)

  2. Uso de Docker en Debian Jessie (parte 2)

  3. Crear una imagen Docker …


Continue reading