Faire de la data science en Python.
Bibliothèque logicielle de PyData.
Pandas manipule le concept de Data Frame (df), qui est un tableau de données.
Le module Panda doit avant tout être importé. Par exemple :import pandas as pd
API | Commentaire | |
---|---|---|
Lecture de fichier | df = pd.read_csv('path/to/myFile.csv', sep ='|', encoding='iso-8859-1')<br>
df = pd.read_excel('path/to/myFile.xls') |
CSV, Excel |
Affichage d'un extrait | df.head() |
5 premières lignes, premières et dernières colonnes |
Fusion de df | fusion = df1.merge(df2, on='colonne1') |
|
Appliquer une fonction sur une colonne | df['MyColumn'].apply(lambda x: someTransform(x))) |
conda install pandas