Projeto Integrado Inovação Inteligência de mercado e análise de dados
ATIVIDADES
Situação Problema: Análise Preditiva de Acidentes Rodoviários para Inteligência de Mercado
Contexto:
A Polícia Rodoviária Federal deseja colaborar com empresas privadas (como seguradoras e
concessionárias) para reduzir os riscos e custos associados a acidentes rodoviários. Para isso, você foi
contratado para liderar um projeto que utiliza técnicas de análise de dados e aprendizado de máquina
para criar um modelo preditivo de risco, além de oferecer insights estratégicos para empresas do
setor.
Sua tarefa é realizar uma análise completa da base de dados, construir pipelines de dados eficientes
e criar um modelo preditivo que identifique o risco de acidentes em diferentes condições. O projeto
deve ainda apresentar considerações estatísticas e possíveis aplicações comerciais para os
resultados.
https://github.com/AndersonSalata/projeto-integrado-ciencia-de-dados
DESAFIO:
Construção do Pipeline de Dados
• Objetivo: Criar um pipeline automatizado que processe e transforme os dados brutos de acidentes em
um formato limpo e estruturado para análise.
• Tarefas:
o Tratar valores faltantes ou inconsistentes.
o Realizar transformações necessárias, como encoding de variáveis categóricas (ex.: causa do
acidente, tipo de pista).
PROJETO INTEGRADO
Público
o Otimizar o armazenamento dos dados para processamento rápido (ex.: uso de data lakes ou
bancos de dados colunares).
2. Análise Descritiva e Exploratória
• Objetivo: Gerar insights preliminares sobre os padrões de acidentes.
• Tarefas:
o Calcular métricas descritivas, como a distribuição de acidentes por tipo, horário e condição
climática.
o Realizar análises de correlação entre fatores como “número de veículos envolvidos” e
“gravidade do acidente”.
o Construir visualizações (gráficos, heatmaps) para destacar padrões significativos.
3. Desenvolvimento do Modelo Preditivo
• Objetivo: Criar um modelo preditivo para estimar a gravidade dos acidentes com base nos dados
disponíveis.
• Tarefas:
o Escolher as variáveis mais relevantes (ex.: tipo de pista, condições meteorológicas, horário).
o Dividir os dados em conjuntos de treino e teste (ex.: 80/20).
o Treinar e validar modelos como árvores de decisão, random forest ou regressão logística.
o Avaliar o modelo com métricas como precisão, recall e F1-score.
4. Aplicação de Inteligência de Mercado
• Objetivo: Traduzir os resultados em aplicações práticas para empresas privadas.
• Tarefas:
o Identificar como seguradoras podem ajustar prêmios de seguro com base no risco predito
para diferentes trechos ou condições.
o Sugerir áreas prioritárias para investimentos de concessionárias (ex.: melhorias em trechos
críticos).
o Desenvolver relatórios visuais (dashboards) que facilitem o entendimento dos insights pelos
stakeholders.
Entrega Final: Relatório Resumido
Pipeline de Dados: Um fluxo documentado e funcional de ETL (extração, transformação e carregamento) com
os dados prontos para análise e modelagem.
Análise Exploratória: Gráficos e tabelas detalhando os padrões mais significativos da base de dados.
PROJETO INTEGRADO
Público
Modelo Preditivo: Um modelo funcional que preveja a gravidade dos acidentes com base em variáveis-chave,
acompanhado de explicação sobre o desempenho do modelo e possíveis melhorias.
Relatório de Inteligência de Mercado:
• Resumo Executivo: Apresente os principais insights encontrados.
• Aplicações Práticas: Mostre como os resultados podem ser utilizados por seguradoras e
concessionárias para tomada de decisão.
• Recomendações Estratégicas: Destaque melhorias ou mudanças que podem ser implementadas para reduzir riscos e custos relacionados a acidentes rodoviários.
Projeto Integrado Inovação Inteligência de mercado e análise de dados