Preços de automóveis: Aprendizagem mecânica

Artigo escrito em colaboração com o escritório de advogados GALEA associés. 

O mercado do seguro automóvel está agora num ponto de viragem. Neste mercado já saturado, que oferece poucas margens e espera por veículos autónomos, o desenvolvimento de novos intervenientes está a aumentar a concorrência. Além disso, a lei Hamon (que facilita a mudança de seguradora) e o crescimento das ofertas de veículos por conta própria estão a tornar cada vez mais difícil a retenção de clientes e de bons riscos, em particular. 


Nos próximos anos, as seguradoras automóveis continuarão, portanto, a aperfeiçoar a sua capacidade de individualizar as suas tarifas, respeitando ao mesmo tempo o princípio do agrupamento de riscos, que é a base do seguro, tanto quanto possível. Aqueles que conseguirem fazer com que cada segurado pague o seu “preço justo” poderão fidelizar os seus membros, mantendo ao mesmo tempo o equilíbrio técnico. Inversamente, taxas menos adaptadas levarão a mais e mais anti-selecção. O processo de fixação de preços parece, portanto, ser a principal alavanca para a excelência técnica. 


Como parte do seu trabalho, os consultores da Galea realizaram um estudo para testar duas formas de melhorar o cálculo dos prémios: 


Classicamente, o cálculo do prémio baseia-se num modelo linear generalizado (GLM). A primeira ideia é comparar os resultados obtidos por este modelo com os das abordagens da ciência dos dados. Será que estes diferentes modelos de aprendizagem mecânica (tais como CART, Random Forest ou XGBoost) melhoram as previsões e refinam os critérios de preços?  O modelo é enriquecido pela contribuição de novos dados externos, nomeadamente da telemática fornecida pelo nosso parceiro Ellis-Car. A integração destes dados torna possível isolar comportamentos específicos que os dados históricos disponíveis para as seguradoras não detectam?  Este estudo foi realizado em parceria com a Ellis-Car, que oferece uma solução para frotas de veículos e particulares que combina telemática a bordo, formação e rentabilidade. 


O start-up oferece uma solução de geolocalização e de perfil de condução utilizando um simples smartphone para frotas empresariais. Desenvolvidos no mundo académico, muitas vezes recompensados e afinados por centenas de milhões de quilómetros de condução, os algoritmos de auto-aprendizagem propostos pelo arranque são capazes de detectar em tempo real qualquer desvio no comportamento de condução em relação a todos os condutores. Um sistema de alertas de voz e visuais torna possível modificar o comportamento do condutor de uma forma muito significativa e benéfica para a empresa. Estas melhorias no comportamento de condução são também sustentáveis graças à gamificação da experiência do utilizador. 


O algoritmo Ellis-Car baseia-se num conjunto de várias camadas cartográficas, que são alimentadas por numerosos dados Open Data: tempo, trânsito, visibilidade da estrada, sinalização rodoviária, histórico de acidentes, etc. Estas camadas são também enriquecidas por qualquer viagem feita por um condutor, com o objectivo de poder comparar o comportamento de condução com toda a base de conhecimentos e estimar o risco.

O estudo : 

Inicialmente, os métodos da ciência dos dados são comparados com a abordagem da GLM: 


A Galea realizou um estudo sobre a experiência de sinistros de uma seguradora automóvel para a sua cobertura de responsabilidade civil. O objectivo era modelar o número e o custo dos sinistros do segurado, tanto pela abordagem “clássica” da GPL como pelos métodos da ciência dos dados, e comparar a eficiência dos diferentes modelos obtidos. 


A qualidade dos modelos foi medida pelo Erro Raiz-Mean-Squadrado (RMSE). Quanto mais baixo for o RMSE, melhor será a abordagem. A tabela abaixo mostra os resultados obtidos. A melhor abordagem é indicada a vermelho. 

 

Quadro 1- Resumo dos erros com base no teste (RMSE)    


Para a previsão do número de reivindicações, o modelo GLM provou ser o melhor. As abordagens da ciência dos dados mostram um nível de qualidade semelhante, no entanto, o melhor é a Random Forest.  Relativamente ao custo das reivindicações, a abordagem CART permite uma modelação mais fina do que a GLM.  A análise realizada mostra que, em dois exemplos, os métodos da ciência dos dados oferecem desempenhos comparáveis aos dos modelos lineares. Na maioria das estruturas, a determinação das taxas dos automóveis baseia-se hoje em dia exclusivamente em modelos lineares generalizados GLM, o que é interessante desafiar utilizando diferentes abordagens para determinar caso a caso o mais relevante. 


O facto, porém, é que a GLM é melhor compreendida por muitos operadores e mais fácil para alguns de inserir nos seus sistemas de gestão e OAV. 

As principais abordagens da ciência dos dados : 

A tabela abaixo apresenta as diferentes abordagens tarifárias estudadas. A relevância destes modelos pode ser avaliada de acordo com vários critérios: a velocidade de aprendizagem, a facilidade de explicação do algoritmo e a interpretabilidade dos resultados que o acompanham, a facilidade de parametrização dos modelos e o poder preditivo dos modelos. O quadro abaixo resume estas diferentes noções. 


Leitura da tabela: Quanto mais “+” um modelo tem para um critério estudado, mais eficiente é. 


Isto mostra que os modelos lineares generalizados têm muitas vantagens, e que os resultados dos métodos derivados da ciência dos dados devem ser muito melhores para os suplantar. Esta é talvez uma das razões para a lenta descolagem destes métodos no momento actual. 

Utilização de dados externos da telemática : 

Numa segunda fase, como mencionado na introdução, os modelos foram reforçados pela integração de dados da telemática, mais uma vez fornecidos pelo nosso parceiro Ellis-Car. A Galea utilizou dados externos, fornecidos por um prestador de serviços. Estes dados fornecem informações sobre os tipos de rede rodoviária (percentagem de auto-estradas, densidade populacional, número de semáforos ou paragens, etc.) e sobre os tipos de condução (velocidade média, número de acelerações ou paragens, etc.) para cada zona geográfica. 


 A ideia do estudo era determinar em que medida a adição destes dados públicos (potencialmente utilizáveis por qualquer seguradora) melhoraria a qualidade dos modelos tarifários. Os números abaixo comparam a capacidade preditiva dos diferentes modelos antes e depois de se ter em conta dados externos. Em todos os casos, a adição destes dados melhora significativamente os modelos (ver gráfico abaixo): 

      

Comparação da qualidade da previsão antes / depois da integração de dados telemáticos 


Em conclusão, hoje em dia, a maioria das seguradoras baseiam as suas tarifas em análises GLM, uma vez que os modelos de máquinas de aprendizagem não são geralmente muito utilizados. No entanto, estes métodos revelam-se frequentemente relevantes e por vezes até mais eficazes do que as abordagens tradicionais. No futuro, será interessante testar as duas famílias de abordagens durante as revisões tarifárias e determinar caso a caso qual é a mais relevante, pondo em perspectiva os ganhos técnicos esperados e os custos resultantes da aplicação dos novos métodos. 


Relativamente à contribuição dos dados telemáticos, este estudo mostra, inequivocamente, que a adição de dados externos permite melhorar significativamente a relevância de uma tarifa e, em particular, prever melhor o número de sinistros – um desafio considerável no seguro automóvel. 


A GALEA & associés e Ellis-Car pode ajudá-lo a enriquecer as suas bases de dados e a melhorar os seus algoritmos através da engenharia de características. Especialistas actuariais e cientistas de dados irão assisti-lo na realização de estudos de previsão com a utilização de algoritmos e sua interpretação em todos os campos técnicos: criação de produtos inovadores, preços, provisionamento, optimização de resseguros. 


Fonte: Tarification automobile à l’aide de modèles de machine learning et apport des données télématiques – Galea-associes.eu

TÃO PRONTO PARA COMEÇAR UMA AVENTURA ?
Período experimental gratuito de 45 dias

CONVAINCU ?

Profitez d’une demo gratuite de l’expérience Ellis-Car !

SIGA-NOS

NECESSITA DE AJUDA ?

PMF

Ellis-Car. Todos os direitos reservados, 2014 – 2022