Comment profiter des données ouvertes?
Que vous soyez une entreprise en quête de réponses, un professionnel de l’analytique, un entrepreneur ou simplement un individu curieux, les données ouvertes peuvent constituer une vraie mine d’or. Depuis quelques années, l’open data, ou le mouvement données ouvertes, est en plein essor. Cet article répondra à deux questions principales : Pourquoi a-t-on soudainement accès à autant de données concernant la vie publique, économique et sociale ? Et comment des utilisateurs non experts en analytique peuvent exploiter le potentiel de ces données et en faire un actif important pour leur organisation ou leur usage personnel?
Pourquoi l’Open Data ?
Resté un peu dans l’ombre du Big Data, l’Open Data fait un grand retour avec l’ère du self service BI, c’est à dire la récupération du contrôle de l’information par les utilisateurs des lignes d’affaires. Si l’Open Data suscite autant d’intérêt, c’est parce que les opportunités d’affaires liées à leur exploitation sont innombrables. D’ailleurs, Mckinsey souligne des gains et enjeux liés à l’utilisation des données ouvertes par industrie ; et voici deux exemples très concrets de retombées possibles, pour les industries du transport et de l’énergie :
Transport : Avec l’utilisation de données publiques sur la congestion routière, la localisation des bus ou celle des trains, l’optimisation des trajets et des temps de transport est grandement facilitée. Par exemple, la ville de Washington, DC a réduit les coûts reliés à sa flotte de transport routier de 30% en analysant les données ouvertes pour comprendre comment ses véhicules étaient utilisés dans le but de réduire les dépenses inutiles.
Énergie : Pour cette industrie, c’est une réduction du risque et du coût d’exploration qui peut être atteint par le partage de données géologiques et sismographiques entre les acteurs principaux. On estime qu’entre 15% et 25% des coûts et des délais pourraient être économisés, par projet d’exploration.
Un changement de paradigme ?
Le mouvement des données ouvertes a pris une ampleur considérable ces dernières années à la suite d’un élan de transparence de la part de gouvernements locaux et nationaux partout sur la planète. Pour ne citer qu’elles, on dénombre pas moins de 50 entreprises spécialisées sur l’Open Data et plus de 500 investisseurs sur la plateforme angel.io.
Désormais, l’exploitation de milliers de jeux de données est possible. Par exemple, la Ville de Montréal met à disposition du grand public un grand nombre de données sur son portail données ouvertes, et permet ainsi à chacun de les visualiser, de les télécharger et enfin de les explorer. On y retrouve par exemple la localisation des pistes cyclables, la disponibilité des Bixi, les emplacements des espaces verts de la Ville de Montréal ou encore 111 indicateurs de gestion de la ville de Montréal. On assiste à l'émergence d’un nouvel écosystème composé d’organisations, de start-ups et d’entreprises de toutes tailles qui tirent profit de ces données pour créer ou améliorer leur offre de services. C’est le cas par exemple de la compagnie Open Data Nation qui aide notamment Washigton, DC à devenir une ville plus sécuritaire en fournissant des solutions analytiques basées sur l’intelligence d’affaires et les données ouvertes.
La carte ci-dessous montre les provinces qui ont lancé des programmes dans le but de rendre accessibles leurs données, incluant aussi les municipalités participantes et les projets publics concernant les données ouvertes.
Des initiatives publiques
Accéder à des statistiques et des bases de données librement sur le web n’est pas nouveau. Les portails du gouvernement du Canada et du Québec tels que statcan.gc.ca ou stat.gouv.qc.ca permettaient déjà d’exploiter des données sur la vie publique. À présent, ce sont des municipalités et des organismes qui participent à cet effort de transparence et d’amélioration des services offerts aux citoyens.
Pour continuer à maximiser la portée des données ouvertes dans les années à venir, les quatre principaux enjeux sont les suivants :
- L’effort et la volonté de transparence des organismes publics et des gouvernements
- L’écoute de ces organismes des suggestions des utilisateurs quant aux données à mettre à disposition
- Le développement d’API qui permettent aux développeurs d’interroger les bases de données directement depuis d’autres applications
- La diversification du type de données ouvertes. Classiquement, les données auxquelles les citoyens et les entreprises avaient accès via les données publiques étaient d’ordre macro-économique, or on assiste aujourd’hui à l’apparition de données opérationnelles et de gestion qui concernent tous les aspects de la vie sociétale
Les données ouvertes ont un impact sur toutes les sphères de la société. Une étude d’impact du Ministère des Finances de Finlande souligne des avantages spécifiques en fonction de la partie concernée :
- Les entreprises privées verront s’ouvrir de nouvelles opportunités de croissance et de développement de produits et services innovants
- Les services publics devraient tendre vers plus de productivité
- Les citoyens peuvent espérer des gains de temps et d’argent
Des bénéfices dans toutes les industries
L’utilisation des données ouvertes, disponibles librement sur internet, a un potentiel économique colossal, et ce dans toutes les industries. Les coûts liés à la mise à disposition des données sont nuls ou presque. En un clic, il est possible d’extraire des jeux de données entiers déjà préparés et nettoyés. Le maximum de valeur ajoutée sera atteint en combinant les initiatives liées au Big Data, les systèmes et données propriétaires des entreprises, ainsi que les données ouvertes. Mckinsey annonce des gains potentiels de l’ordre de 3 milliards de dollars dans les 6 industries qui ont été identifiées comme les plus porteuses:
Comment exploiter ces données ?
Cette section est destinée à ceux et celles qui souhaitent apprendre comment mettre à profit ces données rapidement, sans avoir nécessairement de connaissances techniques poussées. Voici les différentes grandes étapes que nous couvrirons aujourd’hui:
1. Télécharger un data-set intéressant
2. Télécharger et installer gratuitement votre outil de dashboarding préféré
3. Importer et explorer les données
1. Téléchargez un data-set
D’abord, la première étape consiste à trouver un jeux de données intéressant. Pour vous aider dans cette tâche, voici une liste non exhaustive de portails de données ouvertes :
- Portail de la Ville de Montréal
- Portail de l’Union Européenne
- Portail de la Banque Africaine de développement
- Portail de la Banque Mondiale
- Portail du gouvernement fédéral des États-Unis
- La société de transport de Montréal
À des fins de démonstration, cherchons des données sur les indicateurs de gestion de la Ville de Montréal sur le portail des données ouvertes. La plupart du temps, les données sont diffusées au format .CSV, format utilisable avec Excel pour des manipulations basiques.
Vous trouverez des sets de données en sélectionnant dans le menu "Données" en haut à gauche. Après avoir cliqué sur le nom du set de données, vous pourrez choisir un format (le plus souvent .xls, .csv, ou .json). Dans le set Indicateurs de performance de la Ville de Montréal, téléchargez le fichier Indicateurs de performance (.csv).
Une fois sur Excel, assurez-vous d’avoir un format qui respecte ce format standard : des données agencées en colonne, avec une ligne correspondant à une information. Les indicateurs de la Ville de Montréal respectent ce format, vous pouvez le confirmer avec l’image ci-dessous. Vous n’avez pas besoin de supprimer les colonnes inutiles, cela pourra se faire directement depuis votre outil de reporting.
2. Installez un outil de reporting
Plusieurs outils vous permettront de faire de beaux tableaux de bord, et ce gratuitement! Voici une liste des plus connus :
- Microsoft Power BI (nécessite une adresse courriel professionnelle)
- Microstrategy Desktop
- Qlik Sense Desktop
Pour la démonstration, nous utiliserons Power BI.
3. Importez et exportez vos données
Une fois le logiciel installé, utilisez l’option “Get Data” pour importer votre fichier de données téléchargé à l’étape 1.
Power BI, comme la plupart de ses concurrents, permet d’utiliser les principaux formats de fichiers textes : .csv, .xls, .xlsx et le format de la plateforme .pbix.
4. Créez votre visualisation
Après avoir chargé les données, vous verrez les métriques et indicateurs contenus dans le fichier sur la fenêtre de droite. Sélectionnez une visualisation pour voir vos possibilités en termes d’analyse et de visualisation. Faites simplement glisser vos données pour définir l’axe, la légende, les valeurs, mais aussi tooltips ou des filtres. En prenant graphique à barre, vous aurez besoin au minimum d’un axe d’analyse et d’une valeur pour créer une visualisation. Vous pourrez ensuite changer le type de graphique selon vos besoins. Faites glisser les indicateurs dans leur catégorie correspondante pour créer une visualisation. C’est aussi simple que ça!
Pour les utilisateurs avancés ou les développeurs, PowerBI permet d’importer du code NodeJS pour créer des graphiques complexes et permet également un paramétrage avancé des visualisations existantes pour les besoins particuliers.
Voici un dashboard basé sur les données des indicateurs de la ville de Montréal, réalisé en très peu de temps, et publié sur le web depuis PowerBI : https://app.powerbi.com/view?r...
En somme, les données ouvertes sont une mine d’or à la portée de tous : organismes publics, entreprises et individus peuvent tous y trouver leur compte s’ils les utilisent à bon escient.
En tant qu’entreprise, le succès d’un virage data-driven pour votre organisation ou votre équipe repose, entre autres, sur l’implication des collaborateurs. Bien trop souvent encore, l’implantation d’un centre de compétence BI est douloureuse, surtout dans les équipes qui ne sont pas encore familières avec une approche data-driven. A l’ère des outils de visualisation faciles d’utilisation et des données ouvertes, créer des outils d’aide à la décision est dorénavant accessible à tous.
Mais ne vous y trompez pas : les bénéfices des données ouvertes dépassent largement le monde professionnel. Prenons par exemple la décision personnelle d’achat d’une propriété. Il peut être intéressant de se pencher sur des indicateurs par quartier comme le prix médian des maisons, le nombre de parcs, le taux de criminalité, la proximité des écoles, ou encore des bibliothèques. Et bien il y a de grandes chances que toutes ces informations soient disponibles gratuitement, a fortiori si vous habitez dans une grande agglomération. En plus de chercher la meilleure affaire, vous vous dotez ainsi d’arguments de négociation intéressants...
Finalement, en affaires comme dans la vie de tous les jours, une utilisation judicieuse des données vous permettra toujours de prendre une meilleure décision!
Autres articles
Intelligence d'affaires
Écosystème de Données et Voies ferrées : Une Métaphore Pertinente
Octobre 2024Tomas Rezek
Intelligence artificielle
Démystifier l’avenir de l’intelligence artificielle : Points clés de l’événement ALL IN 2024 à Montréal
Octobre 2024Djamal Abide
Intelligence d'affaires
Optimisation des coûts Snowflake : l'approche FinOps révolutionnaire
Juillet 2024Loïc Moindrault | Otmane El Idrissi