Accueil / Systèmes d'information / La résolution d’incident Web 10 fois plus rapide chez Bouygues Télécom grâce au Big Data | La Revue du Digital

La résolution d’incident Web 10 fois plus rapide chez Bouygues Télécom grâce au Big Data | La Revue du Digital

[…]

Les délais de résolution d’incident Web pour les services à destination des clients de Bouygues Telecom ont été divisés par dix grâce à la nouvelle plateforme de monitoring reposant sur une architecture Big Data. C’est une solution Open Source développée en internet qui a été déployée. Guillaume Pinot, responsable étude et architecture Web chez Bouygues Telecom, a détaillé les composants de cette plateforme le 2 avril lors du salon Big Data à Paris.

La perception du client qui se connecte au site Web de l’opérateur télécoms est reconstituée et analysée par le service informatique. Les différentes phases d’une connexion de bout en bout sont mesurées.

15 sites Web critiques

Le site Web de Bouygues Telecom accueille 15 millions de visites par mois, pour 100 millions de pages vues.  La plateforme Web destinée aux clients est en fait constituée de plusieurs dizaines de sites Web, dont ceux par exemple qui assurent l’accès pour les tablettes ou les mobiles. Une quinzaine de ces sites sont critiques.

« Ces sites font appel à deux cents services métiers. Et plusieurs systèmes applicatifs sont derrière chaque service métier, même si cela paraît simple » décrit Guillaume Pinot. Il est alors très difficile de démêler quel système est responsable d’un incident. Cela peut prendre plusieurs heures, voire plusieurs jours.Une mesure par robot

La qualité de service était auparavant mesurée par des robots, simulant un utilisateur, avec toujours le même parcours, le même jeu de données, non réconcilié avec les enquêtes auprès des utilisateurs, ni le webanalytic. La nouvelle plateforme s’appuie sur la collecte de données depuis le navigateur Web de l’internaute, les sites Web eux-mêmes et les services métiers.

La solution permet d’améliorer le suivi d’une requête de bout en bout. Par exemple, si le processus de renouvellement d’abonnement en ligne ne fonctionne pas, il y a une analyse du parcours, et la détection de la cause de l’incohérence des données. Auparavant, ce type de souci entraînait du Ping Pong entre les services, c’était assez éprouvant.

Un travail de collecte en cours d’achèvement

Le travail de collecte n’est pas totalement achevé sur le bus du système d’information, idem sur les sites Web. Il est achevé sur la navigation des internautes. Un Javascript permet de suivre le trafic sur le poste client.

Afin d’assurer le suivi des requêtes des internautes, il y a la création d’une base pour le temps réel, qui assure une rétention de faible durée, et une faible volumétrie. Et  il y a une base pivot, qui assure une forte volumétrie.

Les composants employés sont tous Open Source, à l’exception de l’outil de Tableau Software, destiné à la visualisation des données. Bouygues Télécom utilise ainsi le framework Javascript Boomerang, afin de capter les sessions, sur les pages de l’utilisateur.

En central, on trouve une base centrale Hadoop, dans la distribution de Cloudera, l’outil de recherche Elasticsearch et la base de données orientée documents et NoSQL MongoDB. Flume sert à  la collecte des données des logs.

Pour l’exploitation des données, côté équipes techniques, on trouve l’outil de requêtage Hive,  Groovy Grails, qui est une plateforme de développement agile d’applications Web en Java, et Kibana pour interagir avec les données via ElasticSearch.

viaLa résolution d’incident Web 10 fois plus rapide chez Bouygues Télécom grâce au Big Data | La Revue du Digital.

Laisser une réponse

Votre adresse email ne sera pas publiéeLes champs requis sont surlignés *

*