Não adianta termos bons dados se não fizermos boas perguntas
Durante a Segunda Guerra Mundial, estatísticos da equipe de Abraham Wald analisavam todos os aviões que voltavam das batalhas e destavacam as áreas com mais marcas de balas, como na imagem que ilustra este post. O objetivo era identificar onde a estrutura dos aviões deveria ser reforçada da maneira mais eficiente: não muito a ponto de deixar o avião muito pesado, difícil de manobrar e consumindo mais combustível, e nem tão pouco a ponto de deixá-lo vulnerável.
A distribuição das perfurações não era uniforme: as marcas em vermelho da figura representam as áreas atingidas mais frequentemente. Com base nestes dados, onde eles deviam reforçar?
Uma resposta automática, sem pensar muito seria “onde recebe mais tiros.” Até faz sentido: se estão atirando nas asas, é melhor blindá-las para evitar o estrago.
Quais foram as recomendações de Abraham Wald? 1) Não reforçar as áreas mais atingidas; 2) Blindar as áreas sem marca nenhuma, como os motores, por exemplo.
Os aviões que receberam mais tiros nas áreas destacadas foram capazes de voar de volta. Mas os que foram atingidos nas áreas sem marcas sequer voltaram.
Ninguém estava analisando as marcas de balas nos aviões que não voltaram.
Este caso ilustra o Viés de Sobrevivência (Survival Bias), bastante comum quando analisamos dados para testar uma hipótese: se usarmos a única fonte informação disponível como sendo suficiente, vamos ignorar grande parte das causas destes problemas. Às vezes, a resposta mais importante está na informação que está faltando.
Ao analisar uma base de dados, é preciso observar tanto o que está visível quanto o que não está sendo respondido à primeira vista. O que os dados não respondem é tão importante quanto o que eles respondem. Como a quantidade de informação faltante é sempre infinitamente maior do que a informação disponível, é preciso fazer as perguntas certas.
Quais são as perguntas certas? São as que restringem as suposições e aumentam as certezas.
Por exemplo, o proverbial pico de chamados na segunda-feira é um fenômeno típico no Service Desk de praticamente todas as empresas.
A primeira e principal razão apontada como causa do problema é que os funcionários das grandes empresas – principalmente aqueles que trabalham nos escritórios das grandes cidades – costumam fazer home office nas sextas, então o volume maior de acionamentos é na segunda-feira.
Mas será mesmo que é só por conta disso? Algumas perguntas certas que poderiam ser feitas nessa situação:
- Quais são exatamente os problemas reportados com uma frequência tão maior na segunda-feira? Quais destes problemas também apresentam uma redução similar na sexta-feira?
- Este tipo de problema só acontece quando o funcionário está no escritório, mas não quando ele está em casa? Um problema com a impressora multifuncional, por exemplo, é um caso desse tipo;
- Se forem situações corriqueiras, quais problemas reportados na segunda-feira já estavam acontecendo desde a sexta-feira?
- Por que os usuários esperaram até a segunda-feira para acionar o Service Desk e reportar esse problema? Será que os canais de acionamento do Service Desk para usuários fora do escritório é suficientemente amigável?
- Há algum aumento nos chamados de dúvidas na operação de aplicações corporativas? Talvez o usuário estava esperando até a segunda-feira para pedir ajuda a um colega, e – se não obtendo sucesso – acabou acionando o Service Desk;
As respostas para estas perguntas vão ajudar a substituir as suposições por fatos:
- Os canais de autoatendimento não são amigáveis ou não são acessíveis para o funcionário fora da rede corporativa, conectado por VPN;
- Existem soluções de contorno não documentadas que os usuários descobriram para continuar o trabalho apesar dos problemas;
- Os chamados de dúvidas seriam evitados com uma base de conhecimento – que também precisa ser acessível e amigável ao usuário remoto;
- Algumas aplicações tem um uso tão baixo na sexta-feira que faz mais sentido realizar as manutenções programadas na quinta-feira à noite ao invés de fazer no final de semana;
O interessante é que estas perguntas e respostas nasceram de uma única fonte: o volume maior de chamados no Service Desk na segunda-feira.
Agora imagine o que é possível descobrir analisando as outras fontes de informação com esta mesma abordagem.
Fonte: IBM, Carlos Demerio