#Chargement du module pandas
import pandas as pd
#création du dataframe "produits"
produits = pd.read_excel("D:/ENSEIGNEMENTS/2021 - 2022/DATA SCIENCE/PARTIE 2/Produits.xlsx")
produits.head(7)
Nom | Categorie | Origine | Ville | Prix | Stock | Valeur | |
---|---|---|---|---|---|---|---|
0 | Alice Mutton | Viandes | CEE | Lyon | 195.0 | 0 | 0.0 |
1 | Aniseed Syrup | Condiments | Exterieur | Paris | 50.0 | 25 | 1250.0 |
2 | Boston Crab Meat | Poissons et fruits de mer | Exterieur | Paris | 92.0 | 30 | 2760.0 |
3 | Camembert Pierrot | Produits laitiers | Exterieur | Paris | 170.0 | 0 | 0.0 |
4 | Carnarvon Tigers | Poissons et fruits de mer | Exterieur | Lyon | 312.5 | 0 | 0.0 |
5 | Chai | Boissons | CEE | Lyon | 90.0 | 10 | 900.0 |
6 | Chang | Boissons | Exterieur | Lyon | 95.0 | 25 | 2375.0 |
produits.tail(5)
Nom | Categorie | Origine | Ville | Prix | Stock | Valeur | |
---|---|---|---|---|---|---|---|
72 | Uncle Bob's Organic Dried Pears | Produits secs | Exterieur | Paris | 150.00 | 10 | 1500.0 |
73 | Valkoinen suklaa | Desserts | CEE | Paris | 81.25 | 30 | 2437.5 |
74 | Vegie-spread | Condiments | Exterieur | Paris | 219.50 | 5 | 1097.5 |
75 | Wimmers gute Semmelknödel | Pâtes et cereales | CEE | Lyon | 166.25 | 30 | 4987.5 |
76 | Zaanse koeken | Desserts | Exterieur | Lyon | 47.50 | 0 | 0.0 |
produits.describe()
Prix | Stock | Valeur | |
---|---|---|---|
count | 77.000000 | 77.000000 | 77.000000 |
mean | 144.331818 | 12.467532 | 1507.798701 |
std | 169.075557 | 10.931105 | 2585.013287 |
min | 12.500000 | 0.000000 | 0.000000 |
25% | 66.250000 | 0.000000 | 0.000000 |
50% | 97.500000 | 10.000000 | 900.000000 |
75% | 166.250000 | 25.000000 | 1950.000000 |
max | 1317.500000 | 30.000000 | 19762.500000 |
La moyenne du Prix est 144.33, L'écart type du Stock est 10.93
produits.dtypes
Nom object Categorie object Origine object Ville object Prix float64 Stock int64 Valeur float64 dtype: object
Les variables Prix, Stock et Valeur sont numériques. Les variables Nom, Categorie, Origine et Ville sont catégorielle.
produits.loc[(produits["Categorie"]=="Boissons"),["Nom", "Categorie", "Origine", "Prix"]]
Nom | Categorie | Origine | Prix | |
---|---|---|---|---|
5 | Chai | Boissons | CEE | 90.00 |
6 | Chang | Boissons | Exterieur | 95.00 |
7 | Chartreuse verte | Boissons | Exterieur | 90.00 |
11 | Côte de Blaye | Boissons | CEE | 1317.50 |
21 | Guaraná Fantástica | Boissons | Exterieur | 22.50 |
28 | Ipoh Coffee | Boissons | Exterieur | 230.00 |
31 | Lakkalikööri | Boissons | CEE | 90.00 |
32 | Laughing Lumberjack Lager | Boissons | CEE | 70.00 |
45 | Outback Lager | Boissons | Exterieur | 75.00 |
53 | Rhönbräu Klosterbier | Boissons | CEE | 38.75 |
57 | Sasquatch Ale | Boissons | CEE | 70.00 |
65 | Steeleye Stout | Boissons | Exterieur | 90.00 |
produits.loc[((produits["Categorie"]=="Boissons")&(produits["Prix"]>100)),["Nom", "Categorie", "Origine", "Prix"]]
Nom | Categorie | Origine | Prix | |
---|---|---|---|---|
11 | Côte de Blaye | Boissons | CEE | 1317.5 |
28 | Ipoh Coffee | Boissons | Exterieur | 230.0 |
produits.loc[((produits["Categorie"]=="Boissons")&(produits["Prix"]>100)&(produits["Origine"]=="CEE")),
["Nom", "Categorie", "Origine", "Prix"]]
Nom | Categorie | Origine | Prix | |
---|---|---|---|---|
11 | Côte de Blaye | Boissons | CEE | 1317.5 |
produits.loc[(((produits["Categorie"]=="Boissons") & (produits["Origine"]=="CEE")) | (produits["Categorie"]=="Condiments"))
,["Nom", "Categorie", "Origine", "Prix"]]
Nom | Categorie | Origine | Prix | |
---|---|---|---|---|
1 | Aniseed Syrup | Condiments | Exterieur | 50.00 |
5 | Chai | Boissons | CEE | 90.00 |
8 | Chef Anton's Cajun Seasoning | Condiments | CEE | 110.00 |
9 | Chef Anton's Gumbo Mix | Condiments | CEE | 106.75 |
11 | Côte de Blaye | Boissons | CEE | 1317.50 |
16 | Genen Shouyu | Condiments | CEE | 77.50 |
19 | Grandma's Boysenberry Spread | Condiments | Exterieur | 125.00 |
23 | Gula Malacca | Condiments | CEE | 97.25 |
31 | Lakkalikööri | Boissons | CEE | 90.00 |
32 | Laughing Lumberjack Lager | Boissons | CEE | 70.00 |
34 | Louisiana Fiery Hot Pepper Sauce | Condiments | CEE | 105.25 |
35 | Louisiana Hot Spiced Okra | Condiments | CEE | 85.00 |
42 | Northwoods Cranberry Sauce | Condiments | Exterieur | 200.00 |
44 | Original Frankfurter grüne Soße | Condiments | Exterieur | 65.00 |
53 | Rhönbräu Klosterbier | Boissons | CEE | 38.75 |
57 | Sasquatch Ale | Boissons | CEE | 70.00 |
63 | Sirop d'erable | Condiments | Exterieur | 142.50 |
74 | Vegie-spread | Condiments | Exterieur | 219.50 |
produits.loc[(produits["Prix"]>70) & (produits["Prix"]<100) ,["Nom", "Categorie", "Origine", "Prix"]]
Nom | Categorie | Origine | Prix | |
---|---|---|---|---|
2 | Boston Crab Meat | Poissons et fruits de mer | Exterieur | 92.00 |
5 | Chai | Boissons | CEE | 90.00 |
6 | Chang | Boissons | Exterieur | 95.00 |
7 | Chartreuse verte | Boissons | Exterieur | 90.00 |
16 | Genen Shouyu | Condiments | CEE | 77.50 |
23 | Gula Malacca | Condiments | CEE | 97.25 |
27 | Inlagd Sill | Poissons et fruits de mer | Exterieur | 95.00 |
31 | Lakkalikööri | Boissons | CEE | 90.00 |
35 | Louisiana Hot Spiced Okra | Condiments | CEE | 85.00 |
45 | Outback Lager | Boissons | Exterieur | 75.00 |
47 | Pavlova | Desserts | CEE | 87.25 |
52 | Ravioli Angelo | Pâtes et cereales | Exterieur | 97.50 |
54 | Röd Kaviar | Poissons et fruits de mer | CEE | 75.00 |
65 | Steeleye Stout | Boissons | Exterieur | 90.00 |
73 | Valkoinen suklaa | Desserts | CEE | 81.25 |
produits.sort_values(by=["Prix"], ascending=True).head(15)
Nom | Categorie | Origine | Ville | Prix | Stock | Valeur | |
---|---|---|---|---|---|---|---|
15 | Geitost | Produits laitiers | CEE | Lyon | 12.50 | 20 | 250.00 |
21 | Guaraná Fantástica | Boissons | Exterieur | Lyon | 22.50 | 0 | 0.00 |
30 | Konbu | Poissons et fruits de mer | CEE | Lyon | 30.00 | 5 | 150.00 |
13 | Filo Mix | Pâtes et cereales | Exterieur | Paris | 35.00 | 25 | 875.00 |
70 | Tourtière | Viandes | CEE | Paris | 37.25 | 10 | 372.50 |
53 | Rhönbräu Klosterbier | Boissons | CEE | Paris | 38.75 | 25 | 968.75 |
71 | Tunnbröd | Pâtes et cereales | CEE | Paris | 45.00 | 25 | 1125.00 |
67 | Teatime Chocolate Biscuits | Desserts | Exterieur | Lyon | 46.00 | 5 | 230.00 |
55 | Røgede sild | Poissons et fruits de mer | Exterieur | Paris | 47.50 | 15 | 712.50 |
76 | Zaanse koeken | Desserts | Exterieur | Lyon | 47.50 | 0 | 0.00 |
29 | Jack's New England Clam Chowder | Poissons et fruits de mer | Exterieur | Lyon | 48.25 | 10 | 482.50 |
33 | Longlife Tofu | Produits secs | Exterieur | Lyon | 50.00 | 5 | 250.00 |
1 | Aniseed Syrup | Condiments | Exterieur | Paris | 50.00 | 25 | 1250.00 |
62 | Sir Rodney's Scones | Desserts | CEE | Lyon | 50.00 | 5 | 250.00 |
64 | Spegesild | Poissons et fruits de mer | Exterieur | Lyon | 60.00 | 0 | 0.00 |
produits.groupby("Categorie").agg({"Prix":"mean"})
Prix | |
---|---|
Categorie | |
Boissons | 189.895833 |
Condiments | 115.312500 |
Desserts | 125.800000 |
Poissons et fruits de mer | 103.412500 |
Produits laitiers | 143.650000 |
Produits secs | 161.850000 |
Pâtes et cereales | 101.250000 |
Viandes | 270.033333 |
produits.groupby("Categorie").agg({"Prix":"min"})
Prix | |
---|---|
Categorie | |
Boissons | 22.50 |
Condiments | 50.00 |
Desserts | 46.00 |
Poissons et fruits de mer | 30.00 |
Produits laitiers | 12.50 |
Produits secs | 50.00 |
Pâtes et cereales | 35.00 |
Viandes | 37.25 |
produits.groupby("Categorie").agg({"Prix":"max"})
Prix | |
---|---|
Categorie | |
Boissons | 1317.50 |
Condiments | 219.50 |
Desserts | 405.00 |
Poissons et fruits de mer | 312.50 |
Produits laitiers | 275.00 |
Produits secs | 265.00 |
Pâtes et cereales | 190.00 |
Viandes | 618.95 |
produits.loc[produits["Categorie"]=="Boissons",:].groupby("Origine").agg({"Prix":"mean"})
Prix | |
---|---|
Origine | |
CEE | 279.375000 |
Exterieur | 100.416667 |
produits.groupby("Categorie").agg({"Nom":"count"})
Nom | |
---|---|
Categorie | |
Boissons | 12 |
Condiments | 12 |
Desserts | 13 |
Poissons et fruits de mer | 12 |
Produits laitiers | 10 |
Produits secs | 5 |
Pâtes et cereales | 7 |
Viandes | 6 |
census = pd.read_excel("Census.xlsx", sheet_name="adult")
census.head()
age | workclass | education | marital_status | occupation | relationship | race | sex | hours_per_week | native_country | classe | |
---|---|---|---|---|---|---|---|---|---|---|---|
0 | 41 | State-gov | Masters | Married-civ-spouse | Exec-managerial | Husband | White | Male | 50 | United-States | more |
1 | 50 | Private | Masters | Divorced | Sales | Not-in-family | White | Female | 50 | United-States | more |
2 | 24 | Private | 7th-8th | Separated | Machine-op-inspct | Own-child | White | Male | 40 | United-States | less |
3 | 27 | Without-pay | HS-grad | Never-married | Farming-fishing | Own-child | White | Female | 40 | United-States | less |
4 | 50 | Private | HS-grad | Married-civ-spouse | Craft-repair | Husband | White | Male | 40 | United-States | less |
census.shape
(48842, 11)
Il y'a 11 variables et 48842 individus
census["sex"].value_counts()
Male 32650 Female 16192 Name: sex, dtype: int64
census["classe"].value_counts()
less 37155 more 11687 Name: classe, dtype: int64
pd.crosstab(census["sex"], census["classe"])
classe | less | more |
---|---|---|
sex | ||
Female | 14423 | 1769 |
Male | 22732 | 9918 |
pd.crosstab(census["sex"], census["classe"], normalize=True, margins=True)
classe | less | more | All |
---|---|---|---|
sex | |||
Female | 0.295299 | 0.036219 | 0.331518 |
Male | 0.465419 | 0.203063 | 0.668482 |
All | 0.760718 | 0.239282 | 1.000000 |
La proportion des more dans l'échantillon global est de 23.93%
pd.crosstab(census["sex"], census["classe"], normalize="index")
classe | less | more |
---|---|---|
sex | ||
Female | 0.890749 | 0.109251 |
Male | 0.696233 | 0.303767 |
La proportion des "more" parmi les hommes est de 30.38%
La proportion des "more" parmi les femmes est de 10.92%