7 ene. 2018

Introducción a Pandas

Pandas es una librería de python para analizar datos, permite multiples entrada de datos.

El artículo se basa en un artículo en inglés Building a neural network with python, y en un tutorial de pandas.

Para este tutorial se usará un conjunto de datos en formato csv  sobre vinos (análisis químico para saber el origen de los vinos).


A continuación de describe paso a paso la forma de manejar los datos a partir del archivo wine_data.csv.

El archivo Pandas.py y el Pandas.ipynb lo pueden descargar de github.

Se importa Pandas como pd:

>>> import pandas as pd

Se extrae los datos del archivo csv y se definen el nombres de las columnas:
>>> wine = pd.read_csv('wine_data.csv', names = ["Cultivator", "Alchol", "Malic_Acid", "Ash", "Alcalinity_of_Ash", "Magnesium", "Total_phenols", "Falvanoids", "Nonflavanoid_phenols", "Proanthocyanins", "Color_intensity", "Hue", "OD280", "Proline"])

Se muestran los primeros datos:
>>> wine.head()


Se muestra las dimensiones de la tabla:
>>> wine.shape
(178, 14)

Se tiene 178 filas y 14 columnas.

Se muestra las 2 primeras filas de la tabla:
wine.loc[[0,1]]


Se muestra las dos primeras filas y las columnas Cultivator y Alchol

>>> wine.loc[[0,1]][["Cultivator","Alchol"]]
 


Está introducción es necesaria ya que en futuros artículos se trabajará mucho con la librería pandas.

Publicar un comentario