Os dados disponibilizados neste site foram obtidos pelo Fórum Brasileiro de Segurança Pública (FBSP) mediante pedidos via Lei de Acesso à Informação – LAI (Lei nº 12.527/2011) junto às Secretarias de Segurança Pública e/ou Defesa Social das 27 Unidades Federativas brasileiras.
Desde 2006, o FBSP coleta, reúne, compatibiliza e dá publicidade às estatísticas criminais consolidadas pelas Secretarias Estaduais de Segurança Pública e/ou Defesa Social por meio do Anuário Brasileiro de Segurança Pública. Esses dados, em séries históricas mais longas e consolidadas, podem ser consultados na aba “Estatísticas criminais”. As informações são apresentadas por Unidade da Federação e estão disponíveis somente os totais de cada tipo de ocorrência criminal por UF, sem detalhamento a respeito do perfil dos fatos, das vítimas ou dos autores.
Em um esforço recente, o FBSP tem solicitado, também junto às Secretarias, dados detalhados sobre Mortes Violentas Intencionais e sobre Estupros – os chamados microdados. Essas informações mais detalhadas, no entanto, estão disponíveis apenas para os anos de 2017 e 2018. A partir dessas bases de dados, é possível consultar as ocorrências criminais por municípios, por mês, por instrumento utilizado, por horário e dia da semana, além do perfil da vítima e sua relação com o autor do crime. Os dados podem ser consultados na aba “Microdados”.
Como não existe no Brasil um formato padronizado para a organização das bases de dados produzidas na área da segurança pública sobre mortes e sobre estupros, cada Unidade Federativa organiza seus microdados de uma forma. Assim, após a coleta das bases pelo FBSP junto às SSP, foi necessário um trabalho de compatibilização e padronização dos microdados para tornar as UFs comparáveis e para possibilitar análises em nível nacional. A descrição sobre o procedimento de padronização das bases de dados pode ser lida a seguir.
O Fórum Brasileiro de Segurança Pública, através de sua parceira Terranova Consultoria, compatibilizou os microdados enviados, gerando uma única grande base com todos os dados sobre as ocorrências e sobre as pessoas envolvidas. Esse trabalho se deu em duas grandes frentes (i) compatibilização de colunas e (ii) geração de bases de dados de vítimas.
Foram solicitadas as seguintes informações, feitas as devidas adequações em se tratando de crimes sexuais ou de mortes violentas:
Em muitos casos, os dados brutos disponíveis diziam respeito, separadamente, a ocorrências, vítimas e autores, já em outros, dizia respeito diretamente às vítimas. Essa diferença ensejou um processo de cruzamento das tabelas para compatibilização dos resultados.
A geração dos dados de vítimas baseou-se apenas no cruzamento de informações de diferentes tabelas tomando como chave o código identificador da ocorrência. O processo de compatibilização das colunas, por outro lado, levou em conta outros detalhes, pois os protocolos de cadastro das diversas secretarias são diferentes. Cada coluna passou por um procedimento próprio de compatibilização, mas a estratégia geral seguiu dois passos:
Além disso, a base final foi obtida após a aplicação de um conjunto de filtros:
Abaixo, abrimos o processo de compatibilização dos dados das colunas disponíveis para análise. Essas colunas foram selecionadas do total de variáveis tomando como a base as possibilidades de análise e a qualidade das informações disponíveis.
Esta informação constou na maior parte das bases recebidas, mas passou por alguns cuidados. Nos casos em que o nome do município registrado na ocorrência não constava na lista oficial do IBGE, eles foram manualmente revisados e corrigidos para a nomenclatura atual. Em alguns casos, principalmente nas fronteiras entre estados, foram encontrados municípios fora do seu respectivo estado. Essas ocorrências foram mantidas na base, mas preenchemos o nome do município com “Não informado”.
Esta informação foi obtida através da compatibilização dos diversos tipos de registro de data e hora com o padrão brasileiro.
Foi desenvolvida uma lista de relações comuns entre autores e vítimas contendo as categorias “Companheira(o)”, “Ex-Companheira(o)”, “Conhecida(o)”, “Amiga(o)”, “Sem vínculo”, “Parente”. “Pai/Mãe”, “Padrasto/Madrasta”, “Filha(o)”, “Enteada(o)”, “Irmã(o)”, “Prima(o)”, “Tia(o)”, “Cunhada(o)”, “Avó(ô)”, “Neta(o)”, “Professor(a)” e “Outros”. Essas categorias, por sua vez, foram destrinchadas em uma série de sinônimos.
Foi desenvolvida uma lista de relações comuns entre autores e vítimas contendo as categorias “Arma branca” e “Arma de fogo”. Essas categorias, por sua vez, foram destrinchadas em uma série de sinônimos.
Foi desenvolvida uma lista de relações comuns entre autores e vítimas contendo as categorias “Pardo”, “Preto”, “Branco”, “Indígena”, “Amarelo” e “Pardo ou preto”. Essas palavras exatas foram utilizadas para a categorização, exceto nos casos “Pardo”, que foi constituído a partir das palavras “Mulato”, “Sarara” e “Pardo”, e “Pardo ou preto”, que foi a maneira de categorizar a palavra “Negro”, de sentido impreciso neste contexto.
A idade das vítimas e autores foi obtida utilizando a informação que estava disponível para autores e vítimas, podendo ser tanto a data de nascimento quanto um registro direto de idade em anos.