Precios de los coches: Aprendizaje automático

Artículo redactado en colaboración con el bufete de abogados GALEA associés. 

 

El mercado de los seguros de automóviles se encuentra en un punto de inflexión. En este mercado ya saturado, que ofrece pocos márgenes y está a la espera de los vehículos autónomos, el desarrollo de nuevos actores está aumentando la competencia. Además, la ley Hamon (que facilita el cambio de aseguradora) y el crecimiento de las ofertas de pago por uso hacen cada vez más difícil retener a los clientes y a los buenos riesgos en particular. 

 

En los próximos años, las aseguradoras de automóviles seguirán perfeccionando su capacidad de individualizar sus tarifas, respetando al máximo el principio de agrupación de riesgos, que es la base del seguro. Aquellas que consigan que cada asegurado pague su «precio justo» podrán fidelizar a sus miembros manteniendo el equilibrio técnico. Por el contrario, unas tarifas menos adaptadas conducirán a una mayor antiselección. El proceso de tarificación parece, pues, la principal palanca de la excelencia técnica. 

Como parte de su trabajo, los consultores de Galea realizaron un estudio para probar dos formas de mejorar el cálculo de las primas: 

 

Clásicamente, el cálculo de las primas se basa en un modelo lineal generalizado (GLM). La primera idea es comparar los resultados obtenidos por este modelo con los de los enfoques de ciencia de datos. ¿Los diferentes modelos de aprendizaje automático (como CART, Random Forest o XGBoost) mejoran las predicciones y afinan los criterios de tarificación?  El modelo se enriquece con la aportación de nuevos datos externos, especialmente los procedentes de la telemática proporcionada por nuestro socio Ellis-Car. ¿La integración de estos datos permite aislar comportamientos específicos que los datos históricos de que disponen las aseguradoras no detectan?  Este estudio se ha realizado en colaboración con Ellis-Car, que ofrece una solución para flotas de vehículos y particulares que combina telemática a bordo, formación y rentabilidad. 

 

La start-up ofrece una solución de geolocalización y perfilado de la conducción mediante un simple smartphone para flotas de empresas. Desarrollados en el mundo académico, muchas veces recompensados y afinados por cientos de millones de kilómetros de conducción, los algoritmos de autoaprendizaje propuestos por la startup son capaces de detectar en tiempo real cualquier desviación en el comportamiento de conducción en relación con todos los conductores. Un sistema de alertas vocales y visuales permite modificar el comportamiento del conductor de forma muy significativa y beneficiosa para la empresa. Estas mejoras en el comportamiento de conducción son además sostenibles gracias a la gamificación de la experiencia del usuario. 

 

El algoritmo de Ellis-Car se basa en un conjunto de varias capas cartográficas, que se alimentan de numerosos datos Open Data: meteorología, tráfico, visibilidad de la carretera, señales de tráfico, historial de accidentes, etc. Estas capas también se enriquecen con cualquier viaje realizado por un conductor, con el objetivo de poder comparar el comportamiento de la conducción con toda la base de conocimientos y estimar el riesgo.

El estudio : 

En primer lugar, se comparan los métodos de la ciencia de datos con el enfoque del MLG: 


Galea realizó un estudio sobre la experiencia de siniestros de una aseguradora de automóviles para su cobertura de responsabilidad civil. El objetivo era modelizar el número y el coste de los siniestros de los asegurados, tanto por el enfoque «clásico» del MLG como por los métodos de ciencia de datos, y comparar la eficacia de los distintos modelos obtenidos. 


La calidad de los modelos se midió mediante el error medio cuadrático (RMSE). Cuanto menor sea el RMSE, mejor será el enfoque. La siguiente tabla muestra los resultados obtenidos. El mejor enfoque se indica en rojo. 

 

Cuadro 1- Resumen de los errores en la base de pruebas (RMSE)    


Para la predicción del número de siniestros, el modelo GLM resultó ser el mejor. Sin embargo, los enfoques de ciencia de datos muestran un nivel de calidad similar, siendo el mejor el Random Forest.  En cuanto al coste de los siniestros, el enfoque CART permite una modelización más fina que el GLM.  El análisis realizado muestra que, en dos ejemplos, los métodos de ciencia de datos ofrecen rendimientos comparables a los de los modelos lineales. En la mayoría de las estructuras, la determinación de las tarifas de los automóviles se basa hoy exclusivamente en modelos lineales generalizados GLM, que es interesante cuestionar utilizando diferentes enfoques para determinar los más pertinentes caso por caso. 


Sin embargo, el hecho es que el MLG es mejor comprendido por muchos operadores y más fácil de insertar en sus sistemas de gestión y en el VAO para algunos. 

Los principales enfoques de la ciencia de datos : 

El cuadro siguiente presenta los diferentes enfoques tarifarios estudiados. La pertinencia de estos modelos puede evaluarse en función de varios criterios: la velocidad de aprendizaje, la facilidad de explicación del algoritmo y la interpretabilidad de los resultados que lo acompañan, la facilidad de parametrización de los modelos y el poder de predicción de los mismos. La siguiente tabla resume estas diferentes nociones. 


Lectura de la tabla: Cuantos más signos «+» tenga un modelo para un criterio estudiado, más eficiente es. 


Esto demuestra que los modelos lineales generalizados tienen muchas ventajas, y que los resultados de los métodos derivados de la ciencia de los datos deben ser mucho mejores para suplantarlos. Ésta es quizá una de las razones del lento despegue de estos métodos en la actualidad. 

Uso de datos externos de la telemática : 

En un segundo paso, como se mencionó en la introducción, los modelos se reforzaron integrando datos de la telemática, de nuevo proporcionados por nuestro socio Ellis-Car. Galea utilizó datos externos, proporcionados por un proveedor de servicios. Estos datos proporcionan información sobre los tipos de red de carreteras (porcentaje de autopistas, densidad de población, número de semáforos o paradas, etc.) y sobre los tipos de conducción (velocidad media, número de aceleraciones o paradas, etc.) de cada zona geográfica. 


 La idea del estudio era determinar en qué medida la adición de estos datos públicos (por tanto, potencialmente utilizables por cualquier aseguradora) mejoraría la calidad de los modelos tarifarios. Las cifras que aparecen a continuación comparan la capacidad de predicción de los distintos modelos antes y después de tener en cuenta los datos externos. En todos los casos, la adición de estos datos mejora significativamente los modelos (véase el gráfico siguiente): 

      

Comparación de la calidad de la predicción antes / después de la integración de los datos telemáticos 


En conclusión, hoy en día, la mayoría de las aseguradoras basan sus tarifas en análisis GLM, ya que los modelos de máquinas de aprendizaje no suelen estar muy extendidos. Sin embargo, estos métodos resultan a menudo pertinentes y a veces incluso más eficaces que los enfoques tradicionales. En el futuro, será interesante poner a prueba las dos familias de enfoques durante las revisiones de las tarifas y determinar caso por caso cuál es la más pertinente, poniendo en perspectiva las ganancias técnicas esperadas y los costes resultantes de la aplicación de los nuevos métodos. 


En cuanto a la contribución de los datos telemáticos, este estudio muestra, de forma inequívoca, que la adición de datos externos permite mejorar significativamente la pertinencia de una tarifa y, en particular, predecir mejor el número de siniestros, un reto considerable en el seguro de automóviles. 


GALEA & associés y Ellis-Car pueden ayudarle a enriquecer sus bases de datos y a mejorar sus algoritmos mediante la ingeniería de características. Los expertos actuariales y los científicos de datos le ayudarán a realizar estudios predictivos con el uso de algoritmos y su interpretación en todos los ámbitos técnicos: creación de productos innovadores, tarificación, provisión, optimización del reaseguro. 


Fuente :Tarification automobile à l’aide de modèles de machine learning et apport des données télématiques – Galea Associés (galea-associes.eu)

¿PREPARADO PARA EMPEZAR LA AVENTURA?
45 días de prueba gratuita

Ellis-Car. Todos los derechos reservados, 2014 - 2022