Qualidade dos dados

Como tornar os dados brutos acionáveis no comércio eletrônico

Compre um, adquira um

Se os dados não são informação, e a informação não é conhecimento (de acordo com um livro cético sobre as perspectivas da Internet e do comércio eletrônico em 1995), como podemos dar o salto dos dados para saber o que fazer a seguir? Embora possa parecer filosófico, esta também é uma questão muito prática para as empresas que procuram usar os dados disponíveis para tomar decisões inteligentes. Nesta era de sobrecarga de informações, é fácil se perder no caminho rumo a esse objetivo final.

"Dados" refere-se a fatos, números ou sinais não estruturados ou incompletos. Para varejistas e marcas, estes podem ser listas de inventário de produtos, pontos de preços, estatísticas de tráfego na web, e assim por diante. Pedaços de dados devem ser processados e organizados para se tornarem informações, o que, por sua vez, é combinado com experiência e compreensão para chegar ao conhecimento. Perceber quando e como agir sobre o conhecimento é uma vantagem estratégica no domínio comercial. Esta série de definições espelha o ciclo pelo qual as empresas passam para obter uma visão dos vários recursos de informação que acessam.

Uma imagem da pirâmide de conhecimento de informação de dados

A pirâmide de informação-conhecimento de dados, por Joe Gollner

Das Etapas do Conhecimento às Etapas do Processamento de Dados

Um dos procedimentos mais comuns para lidar com dados em muitas organizações é ETL, ou Extrair, Transformar, Carregar:

  • Aextração é a obtenção de dados, geralmente de múltiplas fontes, que podem diferir em qualidade e/ou quantidade. Estes são os próprios dados brutos.
  • Transformação significa limpar os dados para que estejam em conformidade com certos padrões. Uma vez formatados e armazenados corretamente, os dados podem ser considerados informações.
  • Carregar os dados para um destino, como um armazém de dados, permite que eles sejam consultados e analisados, o que leva ao conhecimento. Os dados podem então ser integrados com outros dados.

A ação é o passo final, o mais significativo, mas também o mais desafiador. O curso de ação correto é determinado subjetivamente, tendo em mente seus objetivos junto com o contexto mais amplo do mercado. Por exemplo, a decisão de um varejista sobre vender ou não um novo produto deve ser baseada não apenas em seu objetivo de impulsionar as vendas, mas também na consciência de como o sortimento que ele oferece se compara ao de outros no mercado.

Isto retorna o foco aos dados, completando o loop ETL. Uma empresa orientada por dados monitora constantemente indicadores-chave de desempenho para oportunidades de melhoria e pergunta quais métricas podem estar faltando. Devido à globalização e digitalização das compras, os varejistas são agora forçados a acompanhar os concorrentes dos quais talvez nunca tenham ouvido falar, não apenas os nomes conhecidos. O rastreamento se torna cada vez mais difícil devido à quantidade de pontos de dados que se acumulam ao longo do tempo. A manutenção de registros históricos é a única maneira de detectar tendências nos dados.

Em particular, Wiser é capaz de servir como um oráculo moderno para aqueles interessados em questões relevantes à inteligência do comércio eletrônico. Por exemplo, digamos que você queria saber: "Quão cedo começaram as promoções de vestidos de Páscoa"? Para responder a tal pergunta, o Wiser desenvolveu tecnologias avançadas de informação de produtos que incluem extração na web, classificação automatizada e análise sob demanda.

Transformando informações on-line de produtos em respostas

Então por onde você começa? Encontrando os dados a serem coletados. As homepages dos varejistas, mensagens de e-mail e postagens nas mídias sociais são todas entradas para o sistema de extração do Wiser. A conversão destes em tabelas de dados envolve a análise dos títulos, imagens e preços exibidos, entre outros atributos do produto. Nesse momento, pode-se determinar quais dados contêm uma palavra-chave de interesse ("vestido", "Calvin Klein") ou foram identificados com outras características (vendas oferecidas pela Bloomingdale's ou Dillards). Uma investigação mais aprofundada pode ser feita para emergir percepções relevantes que podem ser apresentadas de acordo com as solicitações dos clientes.

"Lixo dentro, lixo fora" continua sendo uma máxima relevante, uma vez que pode haver discrepâncias ou armadilhas nas informações apresentadas. Os produtos em um determinado website podem não corresponder ao que a prateleira deve consistir - quando os acessórios são incluídos em um agrupamento principalmente para vestidos, por exemplo. Enquanto em teoria um item poderia pertencer a múltiplas categorias de produtos, na prática deveria haver uma única classificação correta para facilitar a precisão das medidas. A maioria dos sites de eCommerce apresenta uma taxonomia definida. Ela aparece como um menu de navegação que começa com categorias de nível superior e mostra progressivamente categorias mais específicas. Mas diferentes websites fazem escolhas diferentes sobre como classificar seus produtos em termos de granularidade e disposição ("Roupas" como uma subcategoria de "Mulheres" ou vice-versa).

A abordagem mais sábia é padronizar a gama de taxonomias varejistas em uma desenvolvida internamente, não considerada superior, mas simplesmente mais funcional para a necessidade de nossos clientes de fazer comparações entre maçãs e maçãs em todo o cenário varejista. Na verdade, uma taxonomia é um sistema de organização do conhecimento que deve evoluir junto com uma empresa. Esta classificação uniforme é uma forma especializada de integração de dados que é necessária como base para todas as percepções fornecidas. Sem um alto nível de confiança sobre a qual categoria de produto uma página web ou um tweet pertence, não poderia haver nenhuma afirmação de grande porte sobre preço ou sortimento.

Alcançar a etapa de tomar uma decisão informada só é possível após um processo cuidadoso de coleta, limpeza e análise de dados. Entretanto, mesmo isso não é garantia de resultados; como no mercado de ações, o desempenho passado não é um preditor perfeito do futuro.

A chave para as empresas comprometidas com esta abordagem estratégica baseada em dados é o investimento em conhecimentos e ferramentas que apóiem o bom senso a longo prazo. Aprender a gerenciar o pipeline de dados e sistemas associados tem um custo, mas vale bem a pena os benefícios potenciais em termos de crescimento e valor.

Escritor contribuinte: Eric Chuk

Ilustração de maquete de notebook

Melhores decisões só podem vir de dados melhores.

Contate-nos hoje
CTA Decoração Imagem 1 CTA Decoração Imagem 2

1 Comentário

Deixe uma resposta

Seu endereço de e-mail não será publicado. Os campos obrigatórios estão marcados com *