Qualité des données

Comment rendre les données brutes exploitables dans le cadre du commerce électronique

Achetez un, prenez un

Si les données ne sont pas des informations, et les informations ne sont pas des connaissances (selon une livre sceptique quant aux perspectives de l'Internet et du commerce électronique en 1995), comment pouvons-nous passer des données à la connaissance de ce qu'il faut faire ensuite ? Bien que cela puisse sembler philosophique, il s'agit également d'une question très pratique pour les entreprises qui cherchent à utiliser les données disponibles pour prendre des décisions intelligentes. En cette ère de surcharge d'informations, il est facile de se perdre en route vers cet objectif final.

Le terme "données" fait référence à des faits, des chiffres ou des signaux qui sont soit non structurés, soit incomplets. Pour les détaillants et les marques, il peut s'agir de listes d'inventaire de produits, de prix, de statistiques sur le trafic Internet, etc. Les données doivent être traitées et organisées pour devenir des informations, qui à leur tour sont combinées avec l'expérience et la compréhension pour arriver à la connaissance. Savoir quand et comment agir sur la connaissance est un avantage stratégique dans le domaine commercial. Cette série de définitions reflète le cycle par lequel les entreprises passent pour obtenir un aperçu des différentes informations ressources auxquelles elles accèdent.

Une image de la pyramide des connaissances de l'information sur les données

La pyramide données-informations-connaissances, par Joe Gollner

Des étapes de la connaissance aux étapes du traitement des données

L'une des procédures les plus courantes pour traiter les données dans de nombreuses organisations est l'ETL, ou Extraction, Transformation, Chargement :

  • L'extraction consiste à obtenir des données, généralement à partir de sources multiples, qui peuvent différer en qualité et/ou en quantité. Il s'agit des données brutes elles-mêmes.
  • Latransformation consiste à nettoyer les données afin qu'elles soient conformes à certaines normes. Une fois formatées et stockées correctement, les données peuvent être considérées comme des informations.
  • Lechargement des données vers une destination, par exemple un entrepôt de données, permet de les interroger et de les analyser, ce qui conduit à la connaissance. Les données peuvent ensuite être intégrées à d'autres données.

L'action est la dernière étape, la plus importante, mais aussi la plus difficile. La bonne ligne de conduite est déterminée subjectivement en gardant à l'esprit vos objectifs et le contexte plus large du marché. Par exemple, la décision d'un détaillant de vendre ou non un nouveau produit doit être fondée non seulement sur son objectif de stimuler les ventes, mais aussi sur sa connaissance de l'assortiment qu'il propose par rapport à celui des autres acteurs du marché.

L'accent est ainsi mis sur les données, complétant la boucle de l'ETL. Une entreprise axée sur les données surveille en permanence les indicateurs de performance clés pour détecter les possibilités d'amélioration et se demande quels sont les paramètres qui pourraient manquer. En raison de la mondialisation et de la numérisation des achats, les détaillants sont désormais obligés de suivre les concurrents dont ils n'ont peut-être jamais entendu parler, et pas seulement les noms connus. Le suivi devient de plus en plus difficile en raison de la quantité de points de données qui s'accumulent au fil du temps. L'enregistrement historique est le seul moyen de détecter les tendances des données.

En particulier, Wiser peut servir d'oracle moderne pour ceux qui s'intéressent aux questions relatives au renseignement sur le commerce électronique. Par exemple, disons que vous voulez savoir "à quelle heure les promotions des robes de Pâques ont-elles commencé ? Pour répondre à une telle question, Wiser a développé des technologies avancées d'information sur les produits qui comprennent l'extraction web, la classification automatisée et l'analyse à la demande.

Transformer les informations en ligne sur les produits en réponses

Alors par où commencer ? Trouver les données à rassembler. Les pages d'accueil des détaillants, les messages électroniques et les messages des médias sociaux sont tous des entrées pour le système d'extraction de Wiser. Pour les convertir en tableaux de données, il faut analyser les titres, les images et les prix affichés, entre autres attributs des produits. À ce stade, il est possible de déterminer quelles données contiennent un mot-clé intéressant ("robe", "Calvin Klein") ou ont été identifiées avec d'autres caractéristiques (ventes proposées par Bloomingdale's ou Dillards). Une enquête plus approfondie peut être menée pour faire ressortir les informations pertinentes qui peuvent être présentées en fonction des demandes des clients.

"Garbage in, garbage out" reste une maxime pertinente, car il peut y avoir des divergences ou des pièges dans les informations présentées. Les produits présentés sur un site web donné peuvent ne pas correspondre à ce que l'étagère est censée contenir, par exemple lorsque des accessoires sont inclus dans un groupe principalement destiné aux robes. Alors qu'en théorie un article pourrait appartenir à plusieurs catégories de produits, en pratique il devrait y avoir une seule classification correcte pour faciliter la précision des mesures. La plupart des sites de commerce électronique proposent une taxonomie définie. Elle apparaît sous la forme d'un menu de navigation qui commence par les catégories de premier niveau et affiche progressivement des catégories plus spécifiques. Mais les différents sites web font des choix différents quant à la manière de classer leurs produits en termes de granularité et de disposition ("Vêtements" comme sous-catégorie de "Femmes" ou vice versa).

L'approche de Wiser consiste à normaliser la gamme de taxonomies des détaillants en une taxonomie développée en interne, non pas considérée comme supérieure, mais simplement plus fonctionnelle pour répondre au besoin de nos clients de faire des comparaisons de pommes à pommes dans le paysage de la vente au détail. En fait, une taxonomie est un système d'organisation des connaissances qui doit évoluer en même temps qu'une entreprise. Cette classification uniforme est une forme spécialisée d'intégration de données qui est nécessaire comme base pour toutes les informations fournies. Sans un niveau de confiance élevé quant à la catégorie de produits à laquelle appartient une page web ou un tweet, il ne serait pas possible de faire de grandes affirmations sur le prix ou l'assortiment.

Il n'est possible de prendre une décision en connaissance de cause qu'après un processus minutieux de collecte, de nettoyage et d'analyse des données. Toutefois, même cela ne garantit pas les résultats ; comme sur le marché boursier, les performances passées ne sont pas un indicateur parfait de l'avenir.

La clé pour les entreprises engagées dans cette approche stratégique axée sur les données est l'investissement dans l'expertise et les outils qui soutiennent un jugement sain à long terme. Apprendre à gérer le pipeline de données et les systèmes associés a un coût, mais les avantages potentiels en termes de croissance et de valeur en valent la peine.

Rédacteur collaborateur : Eric Chuk

Illustration de la maquette d'un ordinateur portable

De meilleures décisions ne peuvent venir que de meilleures données

Rencontrons-nous
CTA Décoration Image 1 CTA Décoration Image 2

1 Commentaire

Laisser une réponse

Votre adresse électronique ne sera pas publiée. Les champs obligatoires sont marqués d'un *.