Não há Inteligência Artificial sem arquitetura da informação

Já faz mais de 50 anos que o tema Inteligência Artificial, ou simplesmente IA, surgiu como campo de estudo. Com o avanço das pesquisas e aumento das capacidades computacionais, hoje em dia praticamente todas as empresas já têm ou possuem planos relacionados à IA em alguma escala, seja em suas ofertas de produtos e serviços ou em seus processos.

Uma pesquisa realizada pelo MIT em conjunto com o Boston Consulting Group envolvendo mais de 3 mil executivos, gestores e analistas mostra que 85% dos entrevistados acredita que IA irá gerar ou sustentar uma vantagem competitiva para suas empresas.

A IDC estima que cerca de US$ 36,8 bilhões serão investidos em IA durante 2019, liderados pelos setores de varejo e bancos (aproximadamente US$ 11,5 bilhões). Entretanto, apesar da grande expectativa, a adoção de IA nas companhias está apenas começando. Há uma grande disparidade entre expectativa e ação.

O que impede as empresas de acelerarem forte na adoção e escalada do uso de IA em seus negócios? Não há uma resposta simples, porém, um dos principais fatores que inibe esta expansão está relacionado à habilidade e maturidade em lidar com dados. Não importa o quão sofisticado sejam os algoritmos, nenhum deles irá superar a falta de dados. Pesquisas apontam que cerca de 80% dos dados das empresas não são estruturados (documentos de texto, páginas de intranets, e outros formatos) e consequentemente não podem ser buscados. Fica a pergunta: como acessar e tirar valor das suas informações?

Não há inteligência artificial sem uma arquitetura de informação (AI) adequada, ou seja, não há IA sem AI. A maior parte do esforço em um projeto de IA reside na coleta/armazenamento de dados e em sua preparação. Cerca de 80% do tempo e esforço de um cientista de dados é gasto em coletar, filtrar e preparar os dados para análise uma vez que os conjuntos de dados possuem vários tamanhos e naturezas distintas e precisam ser preparados e redefinidos para conjuntos que façam sentido para a empresa.

Possuir um time de estrelas em ciência de dados, que irá desenvolver e implementar os algoritmos mais modernos e impactantes sem uma arquitetura de informação robusta e provada é como estar sentado no cockpit de um carro de Fórmula 1 sem saber para que direção se deve ir.

Uma forma simples de descrever essa arquitetura é usar a analogia de uma escada, onde cada degrau representa um estágio de maturidade na estratégia de adoção de IA. Rob Thomas, gerente-geral de dados e IA da IBM utiliza o termo “AI Ladder” para descrever esta jornada.

No primeiro degrau, devem ser tratados os aspectos ligados a coleta e armazenamento dos dados, identificando as fontes e amostras corretas, tornando-os simples e acessíveis.

Em seguida, no segundo, degrau entra a parte de organização e preparação onde os conjuntos de dados serão catalogados, passarão por uma seleção, filtros e ajustes para que possam ser utilizados na geração de insights. Vale destacar que muitas empresas, por vezes, alternam o primeiro e segundo degraus em função da realidade do negócio ou influência passada.

Alguns profissionais acreditam que armazenar todas as informações em um repositório (datalake) antes de prepará-las para uso faz mais sentido, uma vez que o caso determina a preparação, enquanto outros preferem realizar a preparação antes, considerando quais dados um projeto deve ou poderia ter para criar seus modelos. Particularmente, acredito que manter um repositório consistente e “limpo” gera economias e ganhos de esforço e infraestrutura ao longo do processo, bem como uma fundação confiável e segura para expansão futura.

Na sequência, ou terceiro degrau, vem a parte de análise e exploração para geração de insights, conectando os dados ao propósito esperado, validando as informações geradas, calibrando modelos e ajustando os parâmetros. Essa etapa é de fundamental importância visto que valida os resultados esperados.

Uma empresa de varejo nos EUA utilizou dados de compras realizadas na frente de caixa para tentar melhorar a composição de produtos nas lojas, entretanto o modelo só considerava os dados referentes a casos de sucesso, ou seja, casos em que os clientes finalizaram a compra, gerando uma tendência ou viés no modelo. Ao revisar os resultados, decidiram agregar também dados de falha, onde os consumidores desistiam da compra, tornando o modelo mais assertivo.

Finalmente, o quarto e quinto degraus estão ligados a ganhar confiança e transparência na utilização de AI para poder escalar, multiplicar e monitorar os modelos em diversos processos e/ou produtos e serviços. Considerando que o aprendizado dos modelos é contínuo e dados e pessoas possuem vieses, é fundamental monitorar e corrigir distorções que possam comprometer os resultados gerados.

As empresas podem estar em diversos estágios no contato com a tecnologia e testar projetos para entender o valor dos dados e da IA, mas sem dúvida uma jornada robusta requer um enorme esforço de colaboração, integração e governança, visto que os projetos de IA permeiam diversas camadas e divisões nas organizações.

Em outras palavras, utilizando a escada para IA como referência, é necessária uma visão holística que permita integrar pessoas, processos e dados de forma estruturada a fim de gerar os benefícios e resultados esperados.

Fonte: Computerworld

12 de abril de 2019