Latest · December 11, 2021 0

Como a qualidade dos dados afeta o sucesso ou o fracasso de uma campanha política – TechRepublic

A TechRepublic se reuniu com Paul Westcott, vice-presidente de dados da L2, para discutir quais lições podemos tirar dos sucessos e fracassos de 2016 e como o big data está sendo usado agora, sem a narrativa de que os dados falharam. Abaixo está uma transcrição de sua entrevista.

Westcott: Ouvimos muito disso depois da campanha e, especificamente, do que aconteceu com a campanha de Clinton. As pessoas disseram que dependiam de análises. Eles confiaram nesses modelos preditivos e pelo menos é o que estava sendo divulgado publicamente. No final das contas, seus modelos pareciam bem. Seus modelos foram montados de uma forma muito sólida e a equipe estava entre as melhores do país. O que falhou foi o subjacente, um conjunto de dados pobre, que eles haviam recebido.

Não vou mencionar quem, mas esses grandes conjuntos de dados que são fornecidos às campanhas são, em alguns casos, especialmente quando a equipe tem esse tipo de foco analítico ou, às vezes, uma reflexão tardia, enquanto os pulsantes olham para eles e dizem: “Este é o núcleo do que estamos alcançando quando estamos tentando obter nossa amostra de 600 pessoas ou amostra de 1.000 pessoas. “

Portanto, os dados principais são importantes. Os dados subjacentes são importantes. Isso foi realmente o que falhou, porque no arquivo eleitoral nacional de L2, temos 185 milhões de indivíduos. Algumas das pessoas contra quem competimos ou os partidos políticos ou mesmo os secretários de estado, ou seja, os principais provedores de dados, têm 200 milhões, 220 milhões de eleitores em seus arquivos nacionais. Não que os Secretários de Estado sustentem isso, mas individualmente eles somam mais de 220 milhões de eleitores. Então você diz: “Qual é a diferença?” É tudo uma questão de processamento, limpeza, desduplicação e eliminação de dados de lixo. A qualidade dos dados é importante. Portanto, os dados básicos subjacentes que falharam em 2016 para uma série de campanhas precisam ser reavaliados e como eles o processam. Embora a análise e o aprendizado de máquina sejam ótimos, se você estiver construindo sobre um leito de areia, eles não vão se sustentar.

Dan é um escritor, repórter e produtor. Atualmente, ele é repórter da CBS News e anteriormente foi redator sênior da TechRepublic.