L’usage du data mining pour améliorer le service public : Etude expérimentale à la Bibliothèque de Turku, Finlande

Une étude empirique relative à l’usage du data mining pour l’amélioration des services d’une bibliothèque a été réalisée – dans le cadre d’un master à l’université suédophone de Finlande –  par un étudiant du nom de Ming Zhan.

Ouverture de la nouvelle bibliothèque de Turku – Andrei Niemimäki

Description du dataset 

Elle porte sur un jeu de données (dataset) de fréquentation de la bibliothèque de la ville de Turku, la plus grosse bibliothèque publique de la région, sur une période allant du 1er janvier 2009 au 23 juin 2015 soit 2365 jours. Sur ces 2365 jours, 187 correspondent à un jour de fermeture de la bibliothèque (et donc de valeur nulle) ou sont déficients. L’étude a donc finalement porté sur 2178 entités (ou individu). Quatre variables sont relevées au sein du dataset: « visites quotidiennes », « sept jours dans une semaine », « date » et « heures d’ouvertures ».

La relation entre « sept jours » et « visites quotidiennes » a été explorée, aussi, « visites quotidiennes par heure » a été calculée et sélectionnée comme une variable dépendante. En effet, la bibliothèque publique de Turku a différentes heures d’ouverture les jours de semaine et de weekends et les jours de « lundi à dimanche » ont été utilisés comme des facteurs fixes. Une analyse de variance à un facteur (one-way ANOVA) a été utilisé ici. Cette méthode est l’un des algorithmes les plus adaptés pour comparer les différentes influences de variables catégorisées sur la variable dépendante. Les résultats sont présentés dans les tableaux suivants:

Statistiques descriptives des visites quotidiennes

Résultats descriptifs – variable dépendante

Visites quotidiennes par heure

Intervalle de confiance de la moyenne à 95%  

Taille d’échantillon

Moyenne

Ecart type

Erreur type

Majorant

Minorant

1

317

413,6501 42,28275 2,37484 408,9776

418,3226

2

320

397,6114 48,92785 2,73515 392,2302

402,9926

3

322

384,0150 48,31434 2,69245 378,7179

389,3120

4

314

373,7701 63,18973 3,56600 366,7538

380,7865

5

306

360,4023 48,71476 2,78484 354,9223

365,8822

6

301

404,7464 59,75619 3,44429 397,9684

411,5244

7

298

331,6326 73,39283 4,25153 323,2656

339,9995

Total

2178

381,2294 61,34997 1,31458 378,6514

383,8073

(1 = lundi, 2 = mardi, …7 = dimanche)

Résultat de l’analyse de variance sur l’ensemble des jours

Une valeur-p de 0 signifie que la variable dépendante varie significativement entre différents jours de la semaine. Néanmoins, la présence d’une seule valeur pour F permet difficilement de conclure qu’une telle variation puisse s’opérer entre deux jours ou entre tous les jours.

Visites quotidiennes par heures

Somme des carrés

Degrés de liberté

Moyenne quadratique

F

Valeur-p

Entre les groupes

1471283,572

6 245213,929 79,190

,000

Au sein des groupes

6722550,221

2171

3096,522

Total

8193833,793

2177

 

Multi-comparaison des visites quotidiennes sur l’ensemble des jours

Une multi-comparaison est nécessaire pour identifier le modèle (pattern). Le tableau ci-dessous met en évidence que seuls les nombres de visites quotidienne du mardi (2) et du samedi (6) ne montrent pas de différence significative. Exception faite de ce constat, les différences entre les autres jours sont évidentes et peuvent être illustrées par le graphique suivant.

Variable dépendante : visite quotidienne par heure – test Post Hoc (a posteriori)

1

2

3

4

5

6

7

1 ,000 ,000 ,000 ,000 ,047 ,000
2 ,000 ,002 ,000 ,000 ,110 ,000
3 ,000 ,002 ,020 ,000 ,000 ,000
4 ,000 ,000 ,020 ,003 ,000 ,000
5 ,000 ,000 ,000 ,003 ,000 ,000
6 ,047 ,110 ,000 ,000 ,000 ,000
7 ,000 ,000 ,000 ,000 ,000 ,000 ,000

courbe

La courbe ci-dessus met en évidence un décroissement du nombre de visites du lundi au vendredi avant une augmentation massive le samedi, toutefois la fréquentation la plus faible de la Bibliothèque de Turku a lieu le dimanche.

Interprétation des résultats 

En une semaine, le nombre de visites horaires de la bibliothèque de la ville de Turku fluctue de manière importante. Deux pics d’activités apparaissent le lundi et le samedi qui sont respectivement les premiers jours de la semaine et du weekend. Même si certaines raisons conduisent les usagers à davantage venir à la bibliothèque le lundi (le lundi est généralement le jour choisi par les publics pour renouveler ou rendre leurs emprunts), saisir ces tendances de visites permet à la bibliothèque de Turku d’améliorer l’organisation des journées de travail ainsi que des événements.

Premièrement, le résultat met en évidence que les bibliothécaires ont tendance à être davantage occupés par l’accueil du public les lundi et samedi. La répartition de la charge de travail relative aux permanences peut être ajustée sur la base du nombre de visites de ces deux jours.

Deuxièmement, à partir du moment où davantage de personnes sont susceptibles de venir à la bibliothèque le lundi, la réservation de salles pour des réunions ou l’organisation d’événements peuvent être programmées sur d’autres jours de la semaine afin de permettre une plus grande disponibilité des équipes.

Enfin, les informations importantes doivent être diffusées les lundi et samedi car les possibilités qu’elles atteignent un plus grand nombre de citoyens sont meilleures. Les nouveaux services peuvent également être ouverts sur ces périodes, en effet plus d’avis (feedbacks) sont susceptibles d’être collectés en vue d’un usage ultérieur. Les lundi ou samedi peuvent aussi être traités par les autres services publics comme des jours à privilégier pour communiquer à la bibliothèque.

Conclusion : Humanus ex machina

Cette étude de cas met en évidence l’utilité du data mining dans de perfectionnement des services des bibliothèques municipales. Le traitement de la donnée comme une ressource empirique produit ici une piste d’amélioration de la qualité de service de la bibliothèque. Toutefois, il apparaît nécessaire que ce résultat soit interprété par un professionnel du secteur, voire par plusieurs, afin de confirmer la conclusion de l’analyse. S’il est impératif de sortir de la pensée magique inhérente à la perception de la data science par le grand public en mettant l’humain au cœur du processus, il est également imaginable que des analyses futures aux méthodes plus complexes réalisées des datasets plus larges ou plus variés puissent générer des solutions approfondies d’améliorations des services pour les bibliothèques municipales et pour le service public en général.   

Une réflexion au sujet de « L’usage du data mining pour améliorer le service public : Etude expérimentale à la Bibliothèque de Turku, Finlande »

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion /  Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion /  Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion /  Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion /  Changer )

w

Connexion à %s