O Brasil enfrenta um desafio crônico em sua infraestrutura logística: a segurança nas rodovias federais. Entre 2010 e 2017, o país registrou mais de 62 mil mortes nesses trajetos — uma média devastadora de 21 óbitos diários. Além da imensurável perda humana e do trauma psicológico que assola famílias, esses sinistros geram um impacto econômico direto que sobrecarrega o sistema público e a sociedade.

Para quantificar esse cenário, o IPEA e o DENATRAN desenvolveram metodologias que transformam esses eventos em indicadores financeiros, servindo de base para a formulação de estratégias preventivas. É nesse contexto, entre a necessidade de eficiência administrativa e a preservação da vida, que desenvolvi um projeto de Ciência de Dados voltado à gestão pública.
O Projeto: Preditividade como Ferramenta de Gestão
Utilizando dados da Polícia Rodoviária Federal (PRF) entre 2017 e meados de 2020, criei um modelo de inteligência artificial capaz de prever o desfecho de um acidente. O objetivo é antecipar se uma ocorrência resultará em vítimas fatais, feridos ou apenas danos materiais, baseando-se em variáveis como condições climáticas, tipo de pista, horário e fluxo de veículos.
A relevância estratégica dessa ferramenta é clara: embora os acidentes com vítimas fatais sejam numericamente menores que aqueles com feridos (na proporção de 1 para 10), o custo econômico de um óbito para o Estado é quase quatro vezes superior. Se um gestor puder prever a gravidade de um incidente com confiança, ele conseguirá otimizar a distribuição de equipes de resgate, posicionar pontos de fiscalização de forma inteligente e emitir alertas preventivos em tempo real.
Raio-X das Rodovias Brasileiras
A análise exploratória de quase 246 mil registros revelou padrões geográficos e temporais essenciais para o planejamento estatal:
- Geografia do Risco: Estados como Minas Gerais, Santa Catarina e Paraná concentram o maior volume de ocorrências. Rodovias como a BR-101 e a BR-116 permanecem como os eixos mais críticos.
- Fator Humano e Temporal: A “falta de atenção” é a causa predominante, e os finais de semana, especialmente nos meses de férias (dezembro e janeiro), registram os picos de acidentes.
- Dinâmica dos Sinistros: A colisão traseira é o tipo mais frequente, ocorrendo majoritariamente em condições de tempo bom, o que reforça a hipótese de falha humana ou excesso de velocidade.
Do Protótipo à Escala Industrial com Amazon SageMaker
Para elevar o projeto de uma análise acadêmica para um produto de dados robusto, utilizei o Amazon SageMaker. Enquanto ferramentas comuns permitem o processamento local, o SageMaker oferece um ecossistema para treinar, ajustar e colocar modelos em operação (produção) de forma escalável.
Iniciei com um modelo de referência (LinearLearner) que atingiu uma precisão de 0,62. Para um parâmetro de comparação, estudos utilizando redes neurais complexas alcançaram resultados similares (0,60), o que validou a eficácia da nossa abordagem inicial.
Contudo, para buscar maior rigor, implementamos o algoritmo XGBoost. O resultado foi um salto significativo na precisão, chegando a 0,77. Após o ajuste fino de parâmetros, alcançamos o índice de 0,797.
Conclusão: A Generalização no Mundo Real
Para testar a resiliência da IA, aplicamos o modelo a dados inéditos de 2020, simulando o ambiente real de uma rodovia. Mesmo diante de dados não balanceados, a precisão manteve-se em 0,71, demonstrando uma capacidade sólida de generalização.
Em suma, este projeto prova que a integração entre Ciência Política, Gestão Pública e Inteligência Artificial não é apenas possível, mas necessária. Ao antecipar a gravidade dos acidentes, o Estado deixa de ser apenas reativo e passa a atuar de forma cirúrgica na preservação do seu bem mais valioso: a vida dos cidadãos.
Nota editorial: Este artigo foi originalmente publicado em 15/12/2021 no Medium.
O código completo, os datasets e a documentação técnica deste projeto estão disponíveis no GitHub do projeto.