O Instituto Gesto é uma ONG focada em melhorar a eficiência da gestão pública. Entre seus diversos programas, está a atuação nas Secretarias de Educação, que busca propor soluções para o avanço na aprendizagem dos alunos da rede. Para medir este avanço, é necessário realizar diferentes avaliações durante o ano letivo e extrair indicadores do quanto os alunos avançaram em matérias essenciais, como língua portuguesa e matemática.
Neste contexto, a primeira limitação encontrada é no monitoramento dos indicadores, já que Secretarias de Educação possuem diversos sistemas e procedimentos internos que aumentam a complexidade da coleta. É comum o uso de planilhas como meio de armazenamento das avaliações, mas existem casos de uso de plataformas de avaliação que armazenam os resultados em bancos de dados como PostgreSQL ou Oracle. O acesso ao banco de dados pode ser automatizado, mas quando se trata de planilhas, o compartilhamento normalmente é feito por e-mail e não há um repositório centralizado para armazenamento.
A segunda limitação que identificamos está relacionada à como o resultado das avaliações foi armazenado. No dataset utilizado para construção da infraestrutura, encontramos um desafio de normalização. Haviam diferentes planilhas com resultados de uma mesma avaliação. A avaliação era feita bimestralmente e, para cada bimestre, se adotou uma forma diferente de armazenar o resultado. Isso gera um problema de confiança na informação, já que os dados do primeiro bimestre não poderiam ser cruzados com os dados do quarto bimestre, por exemplo.
De forma resumida, foi necessário pensar uma solução que resolvesse tanto a disponibilização quanto a normalização das avaliações. Ao resolver a disponibilização, seríamos capazes de automatizar a coleta dos dados, recuperando informações de diferentes fontes e construindo uma base robusta de avaliações. Ao resolver a normalização, seríamos capazes de unificar avaliações de um mesmo tipo em um dataset único, garantindo previsibilidade e confiança nos indicadores e métricas apresentados ao gestor.
Dado o problema a ser resolvido, a equipe da Pencillabs construiu uma solução utilizando a plataforma ELK. ELK é o acrônimo para ElasticSearch, LogStash e Kibana. Esta plataforma, que é Open Source, permitiu coletar o resultado de diferentes avaliações de forma normalizada, armazenar os dados em uma base única e construir visualizações por meio de dashboards.
Também propomos uma metodologia de normalização, utilizando como exemplo de sucesso o portal de dados de abertos do governo federal. O resultado final foi uma prova de conceito que nos permitiu avaliar a viabilidade de implantação de uma cultura de dados em Secretarias de Educação, garantindo que decisões estratégicas sejam tomadas a partir do monitoramento e coleta de bases de dados diversas.