LES ACCIDENTS DE LA ROUTE EN FRANCE

alt tag

Sommaire:

  1. Introduction
  2. Jeu de données sur les “Accidents corporels de la circulation millésimé (2012/2017)”
    1. Représentation par gravité des accidents par année
    2. Repartition en fonction de la gravité
    3. localisation la plus meurtriere
    4. Comparaison des victimes en fonction de leur sexe
    5. Carte
  3. Traitement du jeu des données des accidents sur l’année 2019 sur Openrefine
    1. Présentation
    2. Fichier Json des traitements
  4. Utilisation de wikidata pour analyser les accidents d’avions dans le monde
    1. Requête: les accidents d’avion dans le monde

Introduction

J’ai choisi de n’utiliser que les données de 2012 et 2017 des accidents corporels de la circulation en France, afin de percevoir l’évolution du nombre d’accidents, selon des thématiques différentes, en 5 ans. Tous les graphiques seront étudiés afin de voir les différences ou ressemblances.

Jeu de données sur les “Accidents corporels de la circulation millésimé”

Pour chaque accident corporel (soit un accident survenu sur une voie ouverte à la circulation publique, impliquant au moins un véhicule et ayant fait au moins une victime ayant nécessité des soins), des saisies d’information décrivant l’accident sont effectuées par l’unité des forces de l’ordre (police, gendarmerie, etc.) qui est intervenue sur le lieu de l’accident. Ces saisies sont rassemblées dans une fiche intitulée bulletin d’analyse des accidents corporels. L’ensemble de ces fiches constitue le fichier national des accidents corporels de la circulation dit « Fichier BAAC » administré par l’Observatoire national interministériel de la sécurité routière “ONISR”. Les bases de données, extraites du fichier BAAC, répertorient l’intégralité des accidents corporels de la circulation, intervenus durant une année précise en France métropolitaine et dans les départements d’Outre-mer.

Représentation par gravité des accidents par année

L’année 2012 a été la plus meurtière ainsi que les années 2016 et 2017. Mais dans l’ensemble il n’y a pas une très grande évolution de la situation. On note aussi que le nombre de bléssé est beacoup plus nombreux que le nombre de ceux qui s’en sortent indemme et les morts. la representaion ci-dessous confirme ctte tendance.

Repartition en fonction de la gravité

localisation la plus meurtrière

Ce diagramme montre qu’il y’a plus d’accident dans les agglomerations que hors agglomerations. On observe ainsi que la mortalité routière a diminué au cours de cette période dans les agglomérations.Les accidents hors agglomérations sont plus mortels.

Respartition de la gravité des accidents en fonctions de l’eclairage de la route

La colonne “Accidents” donne le nombre d’accidents sur le territoire français. La colonne “Gravité” donne la moyenne de la gravité des accidents recensés, selon l’indice de gravité de l’accident utilisé dans le calcul annuel du coût pour la Nation de l’insécurité routière.

Repartition des victimes entre hommes et femmes

On note ici que dans les trois cas de figure, la majorité des victimes sont des hommes. Les hommmes prennent plus de risque qu volant.

Carte

Traitement du jeu de données des accidents sur l’année 2019 pour obtenir un fichier CSV similaire à la version 2012/2017

Présentation

Ce jeu de données sur les accidents corporels de la circulation routière version 2019 est produit par la plateforme ouverte des données publiques françaises. il est composé d’un fichier CSV Bases de données annuelles des accidents corporels de la circulation routière - 2019 et un fichier pdf pour legénder les champs du fichier CSV Descriptif des variables pour le fichier des accidents, données agrégées de 2005 à 2010. Le jeu des données est presque entierement numérique. Les variables dates, les departements , et tous les autres champs sont remplacés par une valeur numérique. Cette configuration complique la lecture des visualisations. Ma mission sur ce projet à été de remplacer les valeurs numeriques par leur nom d’origine afin d’avoir un fichier JSON de traitement unique à appliquer au jeu de données des années futures.

Etapes du traitement sur Openrefine

le format date numérique en lettre

la premiere étape consiste à un traitement automtique avec l’utilisation de wikidata. Dans openrefine on a reconcilier les valueurs numeriques mois avec le type item Q5151 qui reprensente l’unité de temps non régulière et qui sépare l’année calendaire dans wikidata

le code département en nom du département

Même procédé pour le département en utilisant le type item Q6465. Les champs non réconciliés automatiquement ont été fait manuellement

les autres champs

les autres champs définis par des légendes, comme par exemple la variable “plein jour” representée dans le fichier csv par la valeur numérique 1 on été fait manuellement. la commande facette/facette_textuelle permet de les isoler, et openrefine permet d’appliquer une modification isolée d’une ligne sur tous les champs identiques dans le fichier.

Fichier Json des traitements

  {
    "op": "core/mass-edit",
    "engineConfig": {
      "facets": [],
      "mode": "row-based"
    },
    "columnName": "Column4",
    "expression": "value",
    "edits": [
      {
        "from": [
          "13 aôut 1899"
        ],
        "fromBlank": false,
        "fromError": false,
        "to": "13/08/1899"
      }
    ],
    "description": "Mass edit cells in column Column4"
  },
  {
    "op": "core/mass-edit",
    "engineConfig": {
      "facets": [],
      "mode": "row-based"
    }

Aller sur Witransfer pour visionner la totalité du fichier JSON de traitement et le resultat de la transformation sur Openrefine

Utilistaion de wikidata pour analyser les accidents d’avions dans le monde )

Requête: les accidents d’avion dans le monde

#Lieux des accidents d’avions
SELECT ?label ?coord ?place
WHERE
{
   ?subj wdt:P31 wd:Q744913  .
   ?subj wdt:P625 ?coord .
   ?subj rdfs:label ?label filter (lang(?label) = "fr")
}

Résultat