Les fichiers CSV (Comma Separated Values) sont un format de données couramment utilisé pour l'importation et l'exportation de grandes bases de données. Python, grâce à son module csv intégré et la bibliothèque Pandas, offre des outils puissants et flexibles pour travailler avec ces fichiers. Dans cet article, nous allons vous guider à travers le processus de lecture et d'écriture de fichiers CSV en utilisant Python et Pandas.

Comment lire des fichiers CSV avec le module csv

Comment lire un fichier CSV en utilisant le module csv de Python :

import csv

with open('mon_fichier.csv', 'r') as file:
    reader = csv.reader(file, delimiter=';')
    for row in reader:
        print(row)

Explication du code :

  • import csv : Importe le module csv, qui contient les fonctionnalités nécessaires pour lire et écrire des fichiers CSV.

  • with open('mon_fichier.csv', 'r') as file: : Ouvre le fichier 'mon_fichier.csv' en mode lecture ('r').

  • reader = csv.reader(file, delimiter=';') : Crée un objet reader qui peut lire des lignes à partir du fichier CSV en utilisant le délimiteur spécifié.

  • for row in reader: print(row) : Lit chaque ligne du fichier CSV et l'imprime.

Comment écrire des fichiers CSV avec le module csv

Voici comment vous pouvez écrire des données dans un fichier CSV en utilisant Python :

import csv

with open('mon_fichier.csv', 'w', newline='') as file:
    writer = csv.writer(file, delimiter=';')
    writer.writerow(["nom", "age"])
    writer.writerows([["Alice", 23], ["Bob", 27]])

Explication du code :

  • with open('mon_fichier.csv', 'w', newline='') as file: : Ouvre le fichier 'mon_fichier.csv' en mode écriture ('w').

  • writer = csv.writer(file, delimiter=';') : Crée un objet writer qui peut écrire des lignes dans le fichier CSV.

  • writer.writerow(["nom", "age"]) : Écrit une seule ligne contenant les en-têtes de colonne dans le fichier CSV.

  • writer.writerows([["Alice", 23], ["Bob", 27]]) : Écrit plusieurs lignes dans le fichier CSV.

Comment lire et écrire des fichiers CSV avec Pandas

Pandas est une bibliothèque Python pour la manipulation et l'analyse des données. Pour l'utiliser, vous devez d'abord l'installer avec la commande pip :

pip install pandas

Une fois Pandas installé, voici comment vous pouvez lire un fichier CSV :

import pandas as pd

df = pd.read_csv('mon_fichier.csv')

print(df)

Explication du code :

  • import pandas as pd : Importe la bibliothèque pandas et la renomme en 'pd' pour la commodité.

  • df = pd.read_csv('mon_fichier.csv') : Lit le fichier CSV et le charge dans un DataFrame pandas.

  • print(df) : Imprime le DataFrame.

Et voici comment vous pouvez écrire des données dans un fichier CSV avec Pandas :

import pandas as pd

data = {"nom": ["Alice", "Bob"], "age": [23, 27]}
df = pd.DataFrame(data)

df.to_csv('mon_fichier.csv', index=False)

Explication du code :

  • data = {"nom": ["Alice", "Bob"], "age": [23, 27]} : Définit un dictionnaire de listes, où chaque clé représente une colonne du futur fichier CSV, et chaque liste est une série de valeurs pour cette colonne.

  • df = pd.DataFrame(data) : Convertit le dictionnaire en un DataFrame pandas.

  • df.to_csv('mon_fichier.csv', index=False) : Écrit le DataFrame dans un fichier CSV.

En conclusion, La lecture et l'écriture de fichiers CSV sont des compétences essentielles pour les data scientists et les analystes de données. Python, avec son module csv intégré et la bibliothèque Pandas, offre des outils puissants et flexibles pour travailler avec ces fichiers. En utilisant ces outils, vous pouvez écrire des scripts pour automatiser l'importation et l'exportation de données, vous permettant de vous concentrer sur l'analyse et l'interprétation des données.