Processo editorial
A credibilidade de dados-públicos.com.br depende da qualidade e confiabilidade da informação que publicamos. Nesta página descrevemos como selecionamos as fontes, com que frequência atualizamos os dados, como os validamos e o que fazemos quando detectamos erros.
1. Seleção de fontes
Utilizamos apenas fontes oficiais e institucionais. Isso significa que cada dado publicado no site provém de um órgão público brasileiro reconhecido. Nossas fontes incluem, entre outras:
- Diário Oficial da União (DOU) e diários oficiais estaduais.
- Receita Federal do Brasil.
- Portal da Transparência do Governo Federal.
- Portal Nacional de Contratações Públicas (PNCP) e ComprasGov.
- Cadastro Nacional de Estabelecimentos de Saúde (CNES).
- Agência Nacional do Petróleo (ANP).
- Supremo Tribunal Federal (STF) e Superior Tribunal de Justiça (STJ).
- LexML — Rede de Informação Legislativa e Jurídica.
- Banco Central do Brasil, IBGE, Tesouro Nacional e INEP.
- CAIXA, INSS e outros órgãos federais.
Critérios de inclusão: a fonte deve ser um órgão público oficial, dispor de dados em formato acessível (web, API ou dados abertos) e publicar informações de interesse geral para os cidadãos.
Critérios de exclusão: não utilizamos meios de comunicação, blogs, redes sociais, fóruns nem fontes sem verificação, por oficiais que possam parecer.
2. Frequência de atualização
Cada categoria tem seu próprio ritmo de atualização, adaptado à frequência com que a fonte original publica novos dados:
| Categoria | Frequência aproximada |
|---|---|
| Legislação / DOU | Diária (dias úteis) |
| Editais e Fomento | Diária |
| Licitações (PNCP) | Diária |
| Benefícios Sociais | Semanal |
| Combustíveis (ANP) | Semanal |
| Calendário Fiscal | Mensal / conforme publicação da Receita Federal |
| Indicadores Econômicos (BCB) | Diária (séries do Banco Central) |
| Estatísticas IBGE | Diária (notícias e agregados) |
| Transparência | Variável |
| Direitos Trabalhistas | Variável |
3. Validação de qualidade
Cada dado que entra em nosso sistema passa por um processo de validação em várias etapas:
3.1. Validação automática
- Formato: verificação de que os campos obrigatórios estão presentes e no formato correto (datas, valores, identificadores).
- Coerência: detecção de duplicatas, valores fora de faixa e contradições internas.
- Completude: percentual de campos preenchidos em relação ao total esperado.
3.2. Pontuação de qualidade (LLM scoring)
Para determinadas categorias, empregamos modelos de linguagem (LLM) para avaliar a qualidade do conteúdo textual: clareza dos resumos gerados, coerência das classificações temáticas e adequação da linguagem. Este sistema atribui uma pontuação de qualidade a cada registro.
3.3. Revisão de alertas
Os registros que não atingem os limites de qualidade são marcados para revisão manual. Os dados com erros graves são excluídos da publicação até que o problema seja resolvido.
4. Gestão de erros
Apesar de nossos controles, podem ocorrer erros. Quando detectamos um dado incorreto — seja por nossos sistemas de monitoramento ou por aviso de um usuário — seguimos este protocolo:
- Verificação: conferimos o dado contra a fonte original.
- Correção imediata: se o erro está do nosso lado, corrigimos o mais rápido possível.
- Retorno ao usuário: se foi reportado por um usuário, informamos sobre a resolução.
- Melhoria do pipeline: se o erro revela uma falha sistemática, atualizamos as regras de validação para evitar recorrência.
Se encontrar um dado incorreto, agradeceríamos que nos comunicasse em info@dados-públicos.com.br indicando a URL da página afetada e, se possível, uma referência à fonte oficial.
5. Rastreabilidade
Cada dado publicado inclui, sempre que possível, uma referência à sua fonte original e a data da última atualização. Isso permite ao usuário verificar a informação diretamente na fonte institucional.