1. Importez le fichier « iris_data.csv » dans un dataframe intitulé « iris »
2. Affichez les 5 premières lignes du dataframe « iris »
3. Combien le dataframe compte t-il de lignes et de colonnes ?

La dataframe iris compte 5 variables et 150 individus

4. Quelles sont les variables explicatives ? Quelle est la variable cible ?

La variable cible est: "species".

Les variables explicatives sont: "sepal_length, sepal_width, petal_length et petal_width

5. Séparez les variables explicatives dans un objet « X » et la variable cible dans un objet « y ». Vous pourrez utiliser le script suivant :
6. Nous allons à présent constituer un échantillon d’apprentissage et un échantillon de test pour notre modèle. Entrez les commandes suivantes :
7. Nous allons instancier un modèle de classification de type KNN en utilisant 3 comme nombre de voisins
8. Entrainez le modèle sur les données d’apprentissage
9. En utilisant le modèle entrainé, faites la prédiction sur les données de test, et stockez le résultat dans un objet « y_pred »
10. Affichez le contenu de l’objet « y_pred »
11. En utilisant les prédictions et la réalité (y_test), affichez la matrice de confusion
12. Affichez l’efficacité du modèle.
13. Chargez les données « data_breast_cancer.csv » dans un dataframe.
14. En suivant les étapes nécessaires comme ci-dessus (échantillonnage, instanciation, évaluation), concevez deux modèles permettant de prédire la gravité d’une tumeur.
--> Séparation variable cible/variables prédictives
--> Echantillonnage
--> Chargement et instanciation des modèles
--> Entrainement des modèles
--> Prédictions
--> matrice de confusion
--> Efficacité
--> Proba