
Power Bi, Excel- Power Query : Partie 2 (Exemples)
Power Query comme carte mentale
Power Query est rempli de milliers de fonctionnalités pour nettoyer, traiter et gérer les données. C’est pourquoi il est difficile de comprendre l’image globale de celui-ci. J’ai fait une carte mentale de Power Query afin que vous puissiez obtenir une vue holistique. Voyez-le ci-dessous :
Comment utiliser Power Query ? Quatre exemples
Dans cette section, on démontrera comment utiliser Power Query avec quatre exemples complets. Chaque exemple contient des exemples de données et un classeur que vous pouvez télécharger et suivre.
Exemple 1 : Chargement et nettoyage des données sur les employés :
Dans le premier exemple de Power Query, nous allons regarder les données pour un millier d’employés et les nettoyer. Les données sont dans un fichier Excel. Nous le chargerons dans Power Query et effectuerons les activités de nettoyage ci-dessous. Une fois les données propres, nous publierons l’ensemble de données dans Excel pour analyse.
- Connexion au fichier de données de l’employé
- Remplacer le sexe manquant et les valeurs ministérielles
- Supprimer les employés sans salaire
- Extraire le pays de l’employé et supprimer la colonne d’adresse
- Extrait année de participation
- Publier les données dans Excel
Chaque fois qu’il y a de nouveaux employés, nous allons simplement actualiser la connexion Power Query et elle va charger de nouvelles données (après avoir appliqué les étapes de nettoyage) automatiquement. Tout comme la magie. Les instructions ci-dessous montrent comment faire avec Excel Power Query. Vous pouvez appliquer les mêmes étapes dans Power BI aussi.
Étape 1 : Connectez-vous au fichier de jeu de données à partir d’Excel :
Accédez au ruban de données et cliquez sur "à partir d'un fichier" et sélectionnez "Excel" . Pointez sur l’ensemble de données de l’employé.
Voici un rapide re-cap sur la façon de se connecter aux données de Power Query:
Étape 2 : Appliquer les étapes de nettoyage des données dans Power Query :
Une fois les données chargées dans Power Query, vous pouvez appliquer rapidement toutes les étapes de nettoyage des données nécessaires.
Les étapes seront les suivantes :
- Supprimer les lignes du haut : Le fichier contient 2 lignes d’informations d’en-tête qui ne sont pas nécessaires.
Dans l’éditeur Power Query, à l’aide du bouton "supprimer des lignes" , supprimez les deux premières rangées à partir du ruban d’accueil :
- Promouvoir les en-têtes : Maintenant que nos données sont n’ont pas de lignes supplémentaires sur le dessus, utilisons la ligne numéro 3 comme en-tête.
À partir du ruban d’accueil, appuyez simplement sur le bouton "Utiliser la première rangée comme en-tête":
- Remplacez les valeurs manquantes - colonnes sexe et département : Sélectionnez chaque colonne avec des données manquantes et cliquez avec
le bouton droit ou utilisez le bouton « remplacer les valeurs » pour trouver et remplacer les valeurs nulles par des valeurs alternatives.
Par exemple on peut remplacer les "null" dans "Gender" par "autre ":
- Supprimer du personnel sans salaire : Cette opération est aussi appelée "Filtrage". Il suffit d’utiliser le bouton de filtre dans la colonne des salaires et de supprimer toute valeur "null" :
On a illustré les boutons d’écran pour ces 5 étapes de nettoyage de données (avant de les avoir appliquer) sur l’interface utilisateur Power Query ci-dessous :
Étape 3 : Extraire le pays de l’adresse dans une nouvelle colonne :
Jusqu’à présent, toutes nos étapes de nettoyage de données sont en place. Mais maintenant, nous devons ajouter une nouvelle colonne avec le pays de l’employé. Vous pouvez utiliser le ruban "Ajouter une colonne " de Power Query pour effectuer une telles opérations.
Par exemple, pour extraire « USA » de l’adresse "1 Infinite Loop, Los Angels, CA, USA", nous pouvons utiliser l’option "extraire texte après délimiteur" ou "extraire une colonne à partir d'un exemple".
Pour extraire le pays, sélectionnez la colonne d’adresse et utilisez l’option Ajouter une colonne > Extraire > Texte après le délimiteur :
Vous pouvez utiliser une approche similaire pour ajouter « année » à compter de la date de l’adhésion.
Étape 4 : Publier les données dans Excel aux fins d’analyse et de production de rapports :
Une fois que vos données sont propres et prêtes, cliquez sur le bouton "Fermer et charger" dans le ruban d’accueil. Cela chargera les données dans Excel sous forme d’une table. Vous pouvez utiliser cette table pour l’analyse de données ou les rapports.
Comment actualiser :
Chaque fois que de nouvelles données sont ajoutées au fichier de données de l’employé, dirigez-vous vers le fichier Excel avec la connexion
et actualisez-le (raccourci : Ctrl+Alt+F5 rafraîchira toutes les connexions). Votre fichier, l’analyse associée et les graphiques seront tous mis à jour.
Exemple 2 Power Query : Web scraping des données et les remodeler
Dans cet exemple, utilisons Power Query pour gratter les données web de la page "List of Indian States" sur Wikipedia.
Sur cette page, il y a un tableau de données historiques du recensement (illustré ci-dessous) et nous y accéderons à partir de Power Query. Une fois que nous aurons les données, nous les afficherons sous forme de tableaux pour faciliter l’analyse.
Étape 1 : Se connecter à la source de données Web
À partir du ruban de données, utilisez le bouton "à partir du Web". Collez-le sous l’URL https://en.wikipedia.org/wiki/List_of_states_in_India_by_past_population et se connecter.
Power Query affichera tous les tableaux de la page Web. On sélectionne le tableau qui contient les informations qu’on veut et on clique sur le bouton "Transformer" :
Étape 2 : Supprimer les lignes inutiles
La table de Wikipédia a une ligne grande totale inutile. Il suffit de la supprimer avec le bouton "Supprimer les lignes" :
Étape 3 : Unpivoter les données
Les données du recensement se trouvent dans une colonne et chaque population du recensement dans une colonne. Nous pouvons transformer cela en un tableau standard à trois colonnes – état, année, population en utilisant l’option unpivot.
- Cliquez droit sur la colonne d’état.
- Choisissez l’option "unpivot les autres colonnes".