Algorithme des k plus proches voisins

Le problème

Fichiers contenant le pdf du cours ou la vidéo du cours. Pour vous aidez dans le projet, voici une autre vidéo pour savoir faire son propre module.

Exercice : algo k-ppv sur les iris

Un travail évalué en groupe vous attend sur ce projet ! Vous pouvez vous y préparer en regardant la partie ci-dessous. Vous avez besoin de savoir lire un fichier csv, savoir utiliser un dictionnaire et un tableau, faire un graphique avec matplotlib.

Le répertoire de travail pour ce projet sera algo_kppv.

Voici un fichier au format csv (à vous de l'ouvrir pour voir quel symbole a été utilisé pour l'écrire) qui contient des mesures faites sur 3 espèces d'iris (0 = iris setosa, 1 = iris virginica, 2 = iris versocolor) par Edgar Anderson en 1936. Pour chaque iris rencontré, il a noté l'espèce, la longueur et la largeur des pétales (en cm).
La première chose a faire est de représenter les données à l'aide du module matplotlib.pyplot de python (en vous aidant de la rubrique Outils sur le site) pour obtenir quelque chose qui s'approche de ça :

Reprendre dans le cours l'exemple d'implémentation de l'exemple 1 : l'adapter et le compléter pour ce cas sur les iris.
Test à réaliser : déterminer l'espèce de l'iris de coordonnées dans le schéma (2.5,0.75) en prenant 3 voisins et vérifier que c'est un iris setosa. Vous pouvez afficher quelque chose comme