Dans les grandes lignes, il va falloir mettre en place un projet qui nous permette de créer un système de compliance "GDPR". On va limiter le scope de ce problème à la manipulation des fichiers et des données dans HDFS.
L'idée est de développer 2 services :
Nous utiliserons les technologies suivantes :
case classID, Nom, Prenom
////////////////////////////////////
Les données que nous recevons (CSV) ne sont pas tout le temps correctement typées. Dans cette partie, il faudra écrire un fichier de configuration permettant de mapper les données dans le fichier CSV avec les types fournis en configuration. La configuration doit être au format JSON et ressembler à ceci :
{
columns: [
{
"name": "columnName1",
"type": "columnType2"
},
{
"name": "columnName2",
"type": "columnType2"
}
]
}