Archives de l’auteur : Letartean

Présenter des données, quel calvaire…

Dans mon cégep, certains étudiants qui se destinent aux communications et au journalisme sont appelés à suivre le cours de méthodes quantitatives généralement offert aux étudiants de sciences humaines. Ces étudiants me demandent souvent pourquoi ils doivent suivre ce cours, ce que ça leur apportera. La réponse que je leur donne est toujours la même.

Dans le cadre de votre pratique professionnelle, vous serez appelés à présenter ou commenter des données et vous devrez avoir les compétences nécessaires pour poser un jugement critique sur celles-ci.

Pour illustrer cette réalité, j’aimerais présenter ici deux exemples d’articles publiés par des médias québécois sérieux et qui comptent, à mon avis, des erreurs importantes au niveau de la présentation des données.

Les CPE, le privé et la qualité

Dans son édition de septembre 2018, le magazine L’Actualité présente un dossier sur les garderies et la qualité des services qu’ils offrent. Pour illustrer la situation, le magazine publie le graphique suivant à la page 60.CPE Qualité L'actualité sept 2018On y voit une représentation de la distribution de la classification de la qualité, dans différents types d’établissements. Je vous invite, avant de continuer la lecture, à écrire sur un papier votre première impression à la vue de ce graphique. En particulier, comparez les CPE et les garderies non subventionnées en ce qui a trait à la qualité.

Maintenant, regardez de plus près. Vous verrez que la catégorie « un service d’excellente qualité » n’est pas présentée dans le graphique des deux types de garderies non subventionnées, ce qui fausse complètement la comparaison naturelle que font les humains: comment se comparent la première catégorie d’un graphique avec la première catégorie d’un autre graphique.

Une fois ce problème révélé, la différence entre les CPE et les garderies saute aux yeux. Alors que seuls 2% des CPE offrent un service de faible qualité ou inférieur, c’est respectivement 41 et 36% des garderies non subventionnées pour bambins et pour les plus grands qui sont dans ces catégories. Gageons que vous n’aviez pas écrit cela sur votre papier.

La participation aux élections, version cartographique

Le 21 septembre 2018, en préparation pour les élections, le journal Le Devoir a publié sur sa plateforme web un article portant sur les taux de participations des différentes circonscriptions aux élections de 2014.

L’enjeu est important: la participation des Québécois aux élections est en déclin depuis plusieurs années et il est intéressant de se demander où ce déclin est le plus marqué. Le Devoir a tenté de représenter cette situation en plus de proposer une analyse statistique de corrélation entre différentes variables et le taux de participation dans une circonscription.

Si l’idée était bonne, à mon avis, l’exécution a été déficiente. Vous pouvez visiter l’article en suivant ce lien et revenir lire ma critique plus tard.

 

2018-09-21 10_29_55-Vos voisins ont-ils voté_ _ Le Devoir
La section choisie a une couleur mauve foncé (au moins 90% de participation selon l’échelle présentée en haut à droite) mais la participation se la section est à 66,67%. Le taux de participation de la section (66.67%) ne comprend pas le vote par anticipation alors que le taux de la circonscription (77,15%) le comprend. On ne peut comparer ces valeurs.

Allons-y point par point.

1) La carte interactive est intéressante mais la représentation des données est incompréhensible. L’échelle dit que le mauve foncé représente une participation plus élevée que la moyenne de 71,3%, or je ne suis pas arrivé à trouvé une seule section de vote mauve foncée pour laquelle le taux de participation dans la section était supérieur à 70%. En plus, le taux de participation final dans les circonscriptions comprend le vote par anticipation alors que ce n’est pas le cas dans les sections, ce qui rend la comparaison entre ces deux données impossible [ce qui est étrange sachant qu’elles sont présentées côte à côte dans les fenêtres].

2) Les nuages de points présentés sont assez mauvais. D’abord, leur titre ne respecte pas la convention utilisée à peu près partout dans le monde selon laquelle le titre se formule « variable dépendante (sur l’axe vertical) selon variable indépendante (sur l’axe horizontal) ». Par exemple, le premier nuage de points devrait s’appeler « Le taux de chômage selon la participation à l’élection » et non l’inverse. Ensuite, les axes ne sont pas nommés. Cela rend la lecture confuse, particulièrement si les deux variables représentées s’expriment en pourcentage. Le graphique « La participation selon l’obtention d’un diplôme universitaire » est un bon exemple de cette confusion, sans compter que la mesure utilisée pour « l’obtention d’un diplôme universitaire » n’est pas définie.

3) L’analyse de corrélation n’est pas appuyée par des mesures. Si la corrélation semble assez claire entre le taux de chômage et le taux de participation (quoi qu’assez surprenante, à mon humble avis), il n’en est pas de même pour d’autres paires de variables. Par exemple, j’ai montré le graphique représentant le taux de participation et le taux de diplomation à deux collègues et, entre trois enseignants en mathématique, aucun n’aurait dit qu’il existait une corrélation entre ces variables. Notons que l’article affirme que c’est le cas.

Le journalisme de données est à la mode ces temps-ci. Cependant, il faut réfléchir profondément à la méthodologie choisie pour présenter et analyser les données. À défaut de le faire, on risque de créer de la confusion, de mal informer le public ou de faire perdre du sens à la situation analysée. À mon humble avis, c’est le cas ici; l’exécution déficiente de cette analyse fait passer l’article à côté d’un vrai bon sujet de discussion et d’une réflexion posée sur les enjeux sous-jacents.

Présenter et interpréter des données, une compétence essentielle pour le communicateur d’aujourd’hui et de demain

La réalité, c’est qu’on ne peut pas passer à côté. Je vois mal comment on pourrait évoluer dans la sphère politique ou dans les médias sans posséder une minimale capacité à décortiquer des données statistiques ou à les représenter visuellement. C’est une compétence qui permet d’avoir un discours cohérent avec ce que l’on présente.

C’est pour cette raison qu’il est essentiel que nos journalistes et politiciens reçoivent une bonne formation à ce niveau et puissent évoluer dans notre monde où la donnée deviendra de plus en plus importante dans la sphère publique.

 

Note: Merci à François Gagnon de m’avoir montré le graphique de L’Actualité.

Présenter des données, quel calvaire…

Dans mon cégep, certains étudiants qui se destinent aux communications et au journalisme sont appelés à suivre le cours de méthodes quantitatives généralement offert aux étudiants de sciences humaines. Ces étudiants me demandent souvent pourquoi ils doivent suivre ce cours, ce que ça leur apportera. La réponse que je leur donne est toujours la même.

Dans le cadre de votre pratique professionnelle, vous serez appelés à présenter ou commenter des données et vous devrez avoir les compétences nécessaires pour poser un jugement critique sur celles-ci.

Pour illustrer cette réalité, j’aimerais présenter ici deux exemples d’articles publiés par des médias québécois sérieux et qui comptent, à mon avis, des erreurs importantes au niveau de la présentation des données.

Les CPE, le privé et la qualité

Dans son édition de septembre 2018, le magazine L’Actualité présente un dossier sur les garderies et la qualité des services qu’ils offrent. Pour illustrer la situation, le magazine publie le graphique suivant à la page 60.CPE Qualité L'actualité sept 2018On y voit une représentation de la distribution de la classification de la qualité, dans différents types d’établissements. Je vous invite, avant de continuer la lecture, à écrire sur un papier votre première impression à la vue de ce graphique. En particulier, comparez les CPE et les garderies non subventionnées en ce qui a trait à la qualité.

Maintenant, regardez de plus près. Vous verrez que la catégorie « un service d’excellente qualité » n’est pas présentée dans le graphique des deux types de garderies non subventionnées, ce qui fausse complètement la comparaison naturelle que font les humains: comment se comparent la première catégorie d’un graphique avec la première catégorie d’un autre graphique.

Une fois ce problème révélé, la différence entre les CPE et les garderies saute aux yeux. Alors que seuls 2% des CPE offrent un service de faible qualité ou inférieur, c’est respectivement 41 et 36% des garderies non subventionnées pour bambins et pour les plus grands qui sont dans ces catégories. Gageons que vous n’aviez pas écrit cela sur votre papier.

La participation aux élections, version cartographique

Le 21 septembre 2018, en préparation pour les élections, le journal Le Devoir a publié sur sa plateforme web un article portant sur les taux de participations des différentes circonscriptions aux élections de 2014.

L’enjeu est important: la participation des Québécois aux élections est en déclin depuis plusieurs années et il est intéressant de se demander où ce déclin est le plus marqué. Le Devoir a tenté de représenter cette situation en plus de proposer une analyse statistique de corrélation entre différentes variables et le taux de participation dans une circonscription.

Si l’idée était bonne, à mon avis, l’exécution a été déficiente. Vous pouvez visiter l’article en suivant ce lien et revenir lire ma critique plus tard.

 

2018-09-21 10_29_55-Vos voisins ont-ils voté_ _ Le Devoir
La section choisie a une couleur mauve foncé (au moins 90% de participation selon l’échelle présentée en haut à droite) mais la participation se la section est à 66,67%. Le taux de participation de la section (66.67%) ne comprend pas le vote par anticipation alors que le taux de la circonscription (77,15%) le comprend. On ne peut comparer ces valeurs.

Allons-y point par point.

1) La carte interactive est intéressante mais la représentation des données est incompréhensible. L’échelle dit que le mauve foncé représente une participation plus élevée que la moyenne de 71,3%, or je ne suis pas arrivé à trouvé une seule section de vote mauve foncée pour laquelle le taux de participation dans la section était supérieur à 70%. En plus, le taux de participation final dans les circonscriptions comprend le vote par anticipation alors que ce n’est pas le cas dans les sections, ce qui rend la comparaison entre ces deux données impossible [ce qui est étrange sachant qu’elles sont présentées côte à côte dans les fenêtres].

2) Les nuages de points présentés sont assez mauvais. D’abord, leur titre ne respecte pas la convention utilisée à peu près partout dans le monde selon laquelle le titre se formule « variable dépendante (sur l’axe vertical) selon variable indépendante (sur l’axe horizontal) ». Par exemple, le premier nuage de points devrait s’appeler « Le taux de chômage selon la participation à l’élection » et non l’inverse. Ensuite, les axes ne sont pas nommés. Cela rend la lecture confuse, particulièrement si les deux variables représentées s’expriment en pourcentage. Le graphique « La participation selon l’obtention d’un diplôme universitaire » est un bon exemple de cette confusion, sans compter que la mesure utilisée pour « l’obtention d’un diplôme universitaire » n’est pas définie.

3) L’analyse de corrélation n’est pas appuyée par des mesures. Si la corrélation semble assez claire entre le taux de chômage et le taux de participation (quoi qu’assez surprenante, à mon humble avis), il n’en est pas de même pour d’autres paires de variables. Par exemple, j’ai montré le graphique représentant le taux de participation et le taux de diplomation à deux collègues et, entre trois enseignants en mathématique, aucun n’aurait dit qu’il existait une corrélation entre ces variables. Notons que l’article affirme que c’est le cas.

Le journalisme de données est à la mode ces temps-ci. Cependant, il faut réfléchir profondément à la méthodologie choisie pour présenter et analyser les données. À défaut de le faire, on risque de créer de la confusion, de mal informer le public ou de faire perdre du sens à la situation analysée. À mon humble avis, c’est le cas ici; l’exécution déficiente de cette analyse fait passer l’article à côté d’un vrai bon sujet de discussion et d’une réflexion posée sur les enjeux sous-jacents.

Présenter et interpréter des données, une compétence essentielle pour le communicateur d’aujourd’hui et de demain

La réalité, c’est qu’on ne peut pas passer à côté. Je vois mal comment on pourrait évoluer dans la sphère politique ou dans les médias sans posséder une minimale capacité à décortiquer des données statistiques ou à les représenter visuellement. C’est une compétence qui permet d’avoir un discours cohérent avec ce que l’on présente.

C’est pour cette raison qu’il est essentiel que nos journalistes et politiciens reçoivent une bonne formation à ce niveau et puissent évoluer dans notre monde où la donnée deviendra de plus en plus importante dans la sphère publique.

 

Note: Merci à François Gagnon de m’avoir montré le graphique de L’Actualité.

Une réponse à Claude Béland, encore…

Note : Ce texte représente uniquement l’opinion de son auteur qui est dirigeant dans une Caisse du Mouvement Desjardins et est une réponse à l’article « Le service à la clientèle n’est plus la priorité de Desjardins, selon un ancien président » publié sur le site Radio-Canada.ca . Il ne constitue pas une réponse officielle du Mouvement Desjardins à l’article de Radio-Canada, ni ne représente la position officielle du Mouvement Desjardins sur l’évolution de son réseau de distribution.

Avec une constance remarquable, on voit à chaque année un journaliste aller demander à M. Claude Béland son avis sur l’évolution du Mouvement Desjardins et sa réaction face à la fermeture de points de service. Et chaque année, l’ancien président du Mouvement Desjardins reprend sa même critique de l’organisation dont il a été le dirigeant.

Cette année, M. Béland est revenu sur la place publique pour dire que « la rentabilité a désormais pris le pas sur les finalités sociales des caisses populaires ». Lorsque vient le temps de parler de la fermeture de points de services, ce raccourci est si malheureux qu’il n’est pas acceptable de le laisser passer sans répondre.

Pour illustration, voici un exemple de petit point de service de Desjardins, à Saint-Léon-le-Grand. Je ne porte pas de jugement sur l’existence de ce point de service particulier, je ne fais que le représenter à partir d’une image libre. Photo: Fralambert, CC BY-SA 3.0, (source)

Je l’ai dit, je l’ai répété et je le redirai à nouveau : la finalité des coopératives de Desjardins est de répondre aux besoins des membres dans le domaine des services financiers, pas de supporter la vie démocratique et communautaire des villes et villages du Québec. Certes, on peut participer à ce développement par l’entremise des excédents de la Caisse mais en faire la finalité de l’entreprise est tout simplement impossible.

Répondre aux besoins des membres, c’est observer leurs habitudes et créer une offre de service qui est alignée sur celles-ci. Disons-le : une grande majorité des membres de Desjardins ne viennent plus à la Caisse pour leurs opérations quotidiennes. C’est bien normal, ils reçoivent une offre de service à distance extraordinaire, accessible et beaucoup plus versatile que le service en personne en caisse.

Acheter des assurances, obtenir l’aide pour faire des opérations, transférer des fonds entre ses comptes ou à d’autres personnes, faire des placements, des opérations sur les marchés financiers, payer ses comptes, sa carte de crédit, rembourser son hypothèque ou son prêt pour la consommation, voilà autant d’opérations qu’on peut faire en ligne ou par téléphone, dans le confort de son foyer même en dehors des heures d’ouverture de la Caisse. La réalité, c’est que les membres se tournent de plus en plus vers ces moyens pour opérer dans le réseau de Desjardins et ne fréquentent plus les places d’affaires.

D’ailleurs, posez-vous la question si vous êtes membre d’une Caisse : quelle est la dernière fois que vous vous y êtes rendus et qu’y avez-vous accompli? Probablement, à cette dernière occasion, vous y avez fait une opération qui nécessitait des signatures ou des questions qui doivent être posées en personne comme la finalisation d’une hypothèque, la signature d’un contrat d’assurance ou une opération de placement. Dans ce cas, même si un point de service qui était proche de vous ferme, il y a d’autres façons de réaliser ces opérations : un conseiller peut probablement venir chez vous pour les faire ou il y a sûrement un autre point de service certes un peu plus loin de chez vous mais plus moderne et accueillant où on se fera un plaisir de vous recevoir.

Les Caisses ne quittent pas les villes et les villages du Québec, elles se réorganisent pour offrir des services autrement pour répondre aux besoins de leurs membres. Si un point de service dans un village reçoit une dizaine de visites par semaine, est-ce raisonnable de continuer à y maintenir une offre? Pourrait-on penser continuer à servir ces personnes autrement, en ligne ou par téléphone, pour les transactions courantes ou en allant à leur rencontre de façon ponctuelle dans un bureau du village ou à la maison lorsque c’est nécessaire? C’est ça la réalité à laquelle les dirigeants des Caisses sont confrontés. Et, pour le bien de leurs membres qui financent leurs points de service et qui s’attendent à faire affaire avec une coopérative en bonne santé économique, c’est pour ces raisons qu’ils choisissent de déployer leurs services autrement.

Allez voir : même si des points de service sont fermés dans des villages, on peut quand même être membre de Desjardins dans ces localités et obtenir un bon service. Aussi, je suis absolument certain que vous pourrez trouver la marque de la contribution de Desjardins un peu partout dans ces communautés. Un immeuble ayant abrité la caisse revendu à prix avantageux pour créer une garderie, un investissement du fond d’aide au milieu dans les installations de la localité, une aide financière en commandite pour l’équipe de hockey local ou pour le centre d’hébergement pour les aînés de la région, autant de signes qui vous montreront que la Caisse est encore attachée à contribuer à son milieu. En ne finançant plus des bâtiments qui ne sont pas utilisés, on pourra probablement être en meilleure position pour faire cette contribution par le biais des excédents de la Caisse.

En somme, on ne peut pas contester le fait que des Caisses Desjardins décident de fermer des points de service un peu partout au Québec. Cependant, Desjardins est encore plus accessible qu’avant dans toutes les régions du Québec par Internet et par téléphone. C’est cette prestation de services que les membres veulent recevoir. Il n’est qu’économiquement et socialement logique de s’adapter à cette réalité en modifiant la façon de rencontrer les membres et en se concentrant sur ce qu’ils veulent vraiment. Si M. Béland ne voit pas cette évolution autour de lui et souhaite que les Caisses adoptent une stratégie commerciale coûteuse qui fait fi des demandes de leurs membres, c’est peut-être lui qui a oublié la finalité d’une coopérative de services financiers.

Ce n’est pas tout…

L’autre jour, dans le sac publicitaire qui m’a été livré, j’ai trouvé une publicité pour des produits de viande à faire livrer à la maison. La publication était assez louche mais le vase a débordé lorsque j’ai vu ce graphique dans le dépliant:

tout-pour-le-blogue

Si on traduit le texte autour du graphique, on lit: « Quand on compare les proteines, la viande de bison gagne haut la main. Fer par 100g pour le bison, boeuf, poulet, porc et le saumon. »

Ce graphique a tout de suite attiré mon attention. Et vous, voyez-vous un problème?

La bonne représentation pour les bonnes données

Lorsqu’on veut représenter des données dans un graphique, la première chose à faire est de déterminer ce que l’on veut montrer et quels types de représentation sont appropriés pour atteindre ce but.

Ici, le but clairement énoncé est de comparer la teneur en protéines de différentes viandes. Pour ce faire, il faut être en mesure de mettre côte à côte les valeurs proposées. Dans le cas présent, le graphique circulaire rend cette comparaison totalement impossible. En effet, l’oeil humain n’est pas très habile à discerner des grandeurs d’angle. Pour vous en convaincre, demandez-vous ici lequel des segments rouge ou mauve est le plus grand? Ou, comparez la partie verte et la partie mauve plus foncée et essayez de dire avec conviction laquelle est la plus grande. Un graphique à bandes verticales ou horizontales aurait certainement mieux démontré l’avantage de la viande de bison par rapport aux autres.

Montrez-moi le tout!

Cependant, ce n’est pas le pire problème de ce graphique. Quand on y réfléchit plus sérieusement, le choix d’un graphique circulaire apparaît tout simplement comme absurde dans cette situation. En effet, le graphique circulaire est utilisé pour montrer la répartition des unités statistiques d’un tout parmi des sous-catégories. Par exemples, on peut montrer la répartition de la langue maternelle des résidents du Québec en séparant l’ensemble en trois catégories : francophones, anglophones et allophones. Remarquons ici que ces catégories sont exclusives et exhaustives. On ne peut pas avoir deux langues maternelles et on se situe nécessairement dans une de ces trois catégories. Le graphique circulaire serait donc un outil approprié pour représenter le distribution de cette caractéristique parmi les habitants du Québec.

Revenons au graphique montré ici. Il n’y a pas de tout séparé en parties. Le bison, le boeuf le poulet, le saumon et le porc ne sont pas les seules sources de protéines animales dans le monde. On pourrait penser à l’agneau, au cheval, aux autres poissons, etc. Si on sépare ici une tarte entre les types de viandes, qui sait ce que représente l’entièreté de la tarte…

Répétons-le: chaque type de donnée commande un traitement particulier. Il est donc essentiel de se demander quelle est l’intention du graphique et quel est le type d’information à traiter avant de choisir le type de représentation. Si on omet de réfléchir à cela, on risque de se tromper du tout au tout.