Risques charpentier 2
À UNE INTERPRÉTATION CAUSALE
Arthur Charpentier
Professeur d’actuariat à l’Université du Québec, Montréal
Amadou Diogo Barry
Chercheur à l’Institut de santé publique du Québec
Le rôle d’un actuaire dans une entreprise d’assurance est assez souvent d’estimer la probabilité qu’un événement survienne, ou ses possibles conséquences financières, et est également fonction de variables dites « explicatives ». On voit en effet que certaines variables sont « statistiquement corrélées » avec la survenance d’un accident dans l’année, mais prétendre que l’on dispose d’une « explication » est un peu dangereux. Ce sont pourtant les interrogations qui étaient soulevées lors des débats sur la prise en compte du sexe des assurés dans la tarification automobile : si les femmes ont moins d’accident, en moyenne, que les hommes, pourquoi ne pas utiliser cette variable en tarification ? Le problème est que s’arrêter à une étude des corrélations ne permet pas de comprendre ce qui se cache vraiment derrière un phénomène. Charpentier [2014] notait que de telles études pouvaient conduire à des interprétations paradoxales et erronées.
Ainsi que le notait Dubuisson [2008], « comme le reconnaissent les actuaires, la mise en évidence d’un lien causal entre le critère choisi et la variation de la sinistralité s’apparente à la quête du Graal ». Les données massives, le big data, permettent peut-être d’avoir accès à davantage d’information et de mieux comprendre ce qui peut causer un risque. Un exemple classique est un paradoxe, long à saisir par les épidémiologistes, sur la mortalité infantile, le poids des bébés et le tabagisme de la mère. Nous allons reprendre cet exemple ici et analyser comment l’utilisation de données massives a permis de mieux comprendre ce qui pouvait réellement causer une surmortalité infantile.
Risques n° 99
107
Big data : passer d’une analyse de corrélation à une interprétation causale
Le paradoxe du tabagisme et
du