pandák

A Boxplot használata Pythonban

A Boxplot használata Pythonban
A dobozdiagramot az adatkészletek összegzésére használják a box és a whisker plot módszerrel. Ez a funkció segíti a felhasználókat az adatok összesítésének megértésében. A dobozdiagramok nagyon hasznosak lehetnek, ha meg akarjuk tudni, hogy az adatok hogyan oszlanak meg és terjednek. Az adatok ábrázolásához a dobozdiagramban háromféle kvartilis használható. Ezek az értékek tartalmazzák a medián, maximális, minimális, felső kvartilis és alsó kvartilis statisztikai értékeket. Egy dobozdiagram foglalja össze ezeket az adatokat a 25-benth, 50th, és 75th percentilisek. Ez az oktatóanyag megmutatja, hogyan hozhat létre dobozdiagramokat egy adott adatkészlet alapján a pandák és tengeren született Python könyvtárai.

Előfeltétel

Ha Ön új Python-felhasználó, akkor először be kell állítania a környezetet, hogy megjelenítse a dobozdiagram kimenetét. Bármely Python tolmácsot használhat a kód végrehajtásához. Ebben az oktatóanyagban használni fogom spyder3 a kód végrehajtásához. Ha még nem telepítette a pandák és tengeren született könyvtárak előtt, akkor futtassa a következő parancsot a terminálról a könyvtárak telepítéséhez:

$ pip3 telepítse pandákat tengeri születésű

Box-parcellák pandákkal

A boxplot () a metódusa pandák meződiagram-ábrák előállítására szolgál az adatkeret alapján. Ez a módszer sok érvet tartalmaz; Ezen érvek közül néhányat az alábbi példákban használunk. Az oktatóanyag ezen része két példát tartalmaz, amelyek megmutatják, hogyan hozhatók létre dobozdiagramok pandák. Használhat véletlenszerűen generált adatokat a NumPy könyvtárban, vagy CSV fájlok adatait, hogy létrehozzon egy dobozdiagramot pandák.

1. példa: Vázlatos ábrák véletlenszerű értékek alapján

A következő példában a dobozdiagramokat a NumPy és pandák. A NumPy könyvtár a szkriptben adatkeret-objektum létrehozására szolgál, két soros és 5 oszlopot tartalmazó véletlen értékek tömbjének létrehozásával. Az adatkeret tartalma a a fej() módszer. Ezután a boxplot () metódust használnak kék színű, 10-es betűméretű és 30 fokos forgásszögű dobozdiagramok létrehozására az oszlopértékek megjelenítéséhez.

#!/ usr / bin / env python3
# Panda könyvtár importálása
import pandák, mint pd
# Importálja a NumPy könyvtárat a tömb véletlenszámainak létrehozásához
importálja a numpy-t np-ként
"
Adatkészlet generálása véletlenszerűen létrehozott NumPy tömb alapján
és öt oszlopérték
"
adatkeret = pd.DataFrame (np.véletlen.randn (5,5), oszlop = ['2016', '2017', '2018',
„2019”, „2020”])
 
# Nyomtassa ki az adatkeret értékeit
nyomtatás (adatkeret.fej())
# Jelenítse meg a dobozdiagramot az adatkeret értékei alapján
adatkeret.boxplot (grid = 'false', color = 'blue', fontsize = 10, rot = 30)

Kimenet

A következő kimenet jelenik meg a kód végrehajtása után.

2. példa: Dobozdiagramok CSV adatok alapján

Az alábbi példában a diagramdiagramokat CSV-adatokból állítottuk elő. Hozzon létre CSV fájlt bank.csv a következő adatok felhasználásával.

bank.csv

SL, Client_Name, Account_Type, Nem, Egyenleg
1, Maria Hernandez, megtakarítás, nő, 120000
2, Mary Smith, jelenlegi, nő, 40000
3, David Smith, jelenlegi, férfi, 379000
4, Maria Rodriguez, Saving, nő, 56000
5, Mark Lee, megtakarítás, férfi, 93500
6, Jonathan Bing, jelenlegi, férfi, 5900
7, Daniel Williams, Saving, Férfi, 2300
8, Mike Brown, jelenlegi, férfi, 124888
9, Paul Smith, jelenlegi, férfi, 59450
10, Maria Lopez, megtakarítás, nő, 487600

A következő szkriptben a matplotlib könyvtárat használták a dobozdiagram alakméretének beállításához és a kimenet soros megjelenítéséhez. Minden bejegyzés A bank.csv fájl betöltése a read_csv () a metódusa pandák. Ezután az adatkeret első 8 rekordját kinyomtatták a fej() módszer. A boxplot () metódust alkalmaztunk a következő utasításban a négyzetdiagram ábrájának piros színű megrajzolásához 'Fiók Típus' a 'nevű oszloppalEgyensúly."

#!/ usr / bin / env python3
# Pandák importálása a dobozdiagram létrehozásához
import pandák, mint pd
# A matplotlib importálása a dobozdiagram méretének beállításához
import matplotlib.pyplot mint plt
# A get_ipython importálása a kimeneti sor formázásához
az IPythonból importálja a get_ipython fájlt
get_ipython ().run_line_magic ('matplotlib', 'inline')
# Állítsa be az ábra méretét
plt.rcParams ['ábra.figsize '] = (8,4)
# Töltse be az adatkészletet egy CSV fájlból
df = pd.read_csv ("bank.csv ")
# Nyomtassa ki a betöltött adatok első 8 sorát
nyomtatás (df.fej (8))
# Jelenítse meg a négyzetdiagramokat a használt paraméter alapján
df.boxplot (by = 'Account_Type', rács = 'True', oszlop = ['Balance'], color = 'red')

Kimenet

A következő kimenet jelenik meg a kód végrehajtása után.

Doboz telkek tengeri születésű

A Python másik, általában dobozdiagramok rajzolására használt könyvtára a könyvtár tengeren született.  A könyvtár egyik fontos jellemzője, hogy számos beépített mintaadatkészlettel rendelkezik a különböző feladatok tesztelésére. A következő két példa két különböző mintaadatkészlet használatával foglalkozik a dobozdiagramok rajzolásához a tengeren született könyvtár.

3. példa: Dobozdiagramok x paraméter alapján

A következő példa egy mintaadatkészletet használ, amelynek neve:gyémántok ” tól től a tengeri születésű könyvtárat a dobozdiagram előállításához. Itt a rácsstílust a set_style () módszer. A load_dataset () metódust használjuk a 'gyémántok adatkészlet. Az első öt rekordot az adatkészlet és a boxplot () metódus segítségével rajzoljuk meg a dobozdiagramot a megnevezett oszlop alapján 'mélység,kék színű.

# Tengeri születésű könyvtár importálása a dobozdiagram létrehozásához
import tengeri születésű, mint sns
# Importálja a matplotlib-et a dobozdiagram méretének beállításához
import matplotlib.pyplot mint plt
# A get_ipython importálása a kimeneti sor formázásához
az IPythonból importálja a get_ipython fájlt
get_ipython ().run_line_magic ('matplotlib', 'inline')
# Állítsa be a rácsstílust
sns.set_style ("whitegrid")
# Állítsa be az ábra méretét
plt.rcParams ['ábra.figsize '] = (8,4)
# Töltse be a minta adatkészletet
gyémánt_adatkészlet = sns.load_dataset ('gyémántok')
# Az adatkészlet első 5 rekordjának megjelenítése
print (gyémánt_adatkészlet.fej())
# Rajzolja meg a négyzetdiagram ábrát
sns.boxplot (x = gyémánt_adatkészlet ['mélység'], szín = 'kék')

Kimenet

A következő kimenet jelenik meg a kód végrehajtása után.

4. példa: Dobozdiagramok x és y paraméterek alapján

Az alábbi példa a 'mintadatkészletet használja'járatok'a dobozdiagram megrajzolásához. Itt mind az x, mind az y paraméterek a boxplot () módszerrel rajzoljuk meg az ábrát. A többi állítás hasonló az előző példához.

# Tengeri születésű könyvtár importálása dobozdiagram létrehozásához
import tengeri születésű, mint sns
# A matplotlib importálása a dobozdiagram méretének beállításához
import matplotlib.pyplot mint plt
# A get_ipython importálása a kimeneti sor formázásához
az IPythonból importálja a get_ipython fájlt
get_ipython ().run_line_magic ('matplotlib', 'inline')
 
# Állítsa be a rácsstílust
sns.set_style ("darkgrid")
# Állítsa be az ábra méretét
plt.rcParams ['ábra.figsize '] = (12,4)
 
# Töltse be a minta adatkészletet
flight_dataset = sns.load_dataset ('járatok')
# Az adatkészlet első 5 rekordjának megjelenítése
nyomtat (flight_dataset.fej())
 
# Rajzolja meg a négyzetdiagram ábrát
sns.boxplot (x = 'hónap', y = 'utasok', adatok = flight_dataset, color = 'kék')

Kimenet

A következő kimenet jelenik meg a kód végrehajtása után.

Következtetés

Ha nagy mennyiségű adattal dolgozik, érdemes összefoglalni az adatokat egy diagram, például egy dobozdiagram segítségével. Ez az oktatóanyag több példát használt arra, hogy bemutassa, hogyan lehet két Python-könyvtárral létrehozni a dobozdiagramokat.

Az OSD-fedvény megjelenítése teljes képernyős Linux-alkalmazásokban és játékokban
Teljes képernyős játékok lejátszása vagy alkalmazások figyelemelterelés nélküli, teljes képernyős módban történő használata elvághatja a panelen vagy ...
Az 5 legjobb játékrögzítő kártya
Mindannyian láttuk és szerettük a YouTube-on a streaming játékokat. A PewDiePie, a Jakesepticye és a Markiplier csak néhány a legnépszerűbb játékosok ...
Hogyan lehet játékot fejleszteni Linuxon
Egy évtizeddel ezelőtt nem sok Linux-felhasználó jósolta, hogy kedvenc operációs rendszerük egy napon a videojátékok népszerű játékplatformja lesz. El...