Adattudomány

Python Seaborn bemutató

Python Seaborn bemutató
Ebben a leckében a Python Seaborn könyvtárról ennek az adatmegjelenítési könyvtárnak a különböző aspektusait vesszük szemügyre, amelyeket a Python segítségével gyönyörű és intuitív grafikonok előállításához használhatunk, amelyek az adatokat olyan formában jeleníthetik meg, amelyet az üzleti élet szeretne egy platformtól. Hogy ez a lecke teljes legyen, a következő szakaszokat tárgyaljuk:

Úgy tűnik, hogy sokat kell fedezni. Kezdjük most.

Mi az a Python Seaborn könyvtár?

A Seaborn könyvtár egy Python csomag, amely lehetővé teszi számunkra, hogy statisztikai adatok alapján infografikákat készítsünk. Mivel a matplotlib tetején készül, tehát eredendően kompatibilis vele. Ezenkívül támogatja a NumPy és a Pandas adatstruktúrát, így a rajzolást közvetlenül ezekből a gyűjteményekből lehet elvégezni.

A komplex adatok megjelenítése az egyik legfontosabb dolog, amit Seaborn gondoz. Ha a Matplotlibet hasonlítanánk a Seabornhoz, akkor Seaborn képes könnyebbé tenni azokat a dolgokat, amelyeket nehéz elérni a Matplotlib segítségével. Fontos azonban megjegyezni, hogy A Seaborn nem a Matplotlib alternatívája, hanem annak kiegészítője. A lecke során a Matplotlib függvényeket is felhasználjuk a kódrészletekben. Ön a következő felhasználási esetekben választja ki a Seaborn használatát:

Csak egy megjegyzés a kezdés előtt: virtuális környezetet használunk ehhez a leckéhez, amelyet a következő paranccsal készítettünk:

python -m virtualenv tengeri születésű
forrás tengeri születésű / bin / aktiválás

Amint a virtuális környezet aktív, telepíthetjük a Seaborn könyvtárat a virtuális env-be, hogy a következő módon létrehozott példák végrehajthatók legyenek:

pip telepíteni tengeri születésű

Használhatja az Anaconda-t is ezeknek a példáknak a futtatásához, ami könnyebb. Ha telepíteni szeretné a számítógépére, nézze meg a „Hogyan telepítsük az Anaconda Python-ot az Ubuntu 18-ra” című leckét.04 LTS ”, és ossza meg visszajelzését. Most térjünk át a különféle típusú parcellákra, amelyeket a Python Seaborn segítségével lehet megalkotni.

A Pokemon adatkészlet használata

A lecke gyakorlati megőrzéséhez Pokemon adatkészletet fogunk használni, amely letölthető a Kaggle-ről. Ennek az adatkészletnek a programunkba történő importálásához a Pandas könyvtárat fogjuk használni. Itt található az összes import, amelyet a programunkban végrehajtunk:

import pandák, mint pd
a matplotlib import pyplot-tól plt-ként
import tengeri születésű, mint sns

Most importálhatjuk az adatkészletet a programunkba, és a Panda mintadatainak egy részét megjeleníthetjük a következőképpen:

df = pd.read_csv ('Pokemon.csv ', index_col = 0)
df.fej()

Vegye figyelembe, hogy a fenti kódrészlet futtatásához a CSV-adatkészletnek ugyanabban a könyvtárban kell lennie, mint maga a program. Miután futtattuk a fenti kódrészletet, a következő kimenetet látjuk (Anaconda Jupyter jegyzetfüzetében):

Lineáris regressziós görbe ábrázolása

Az egyik legjobb dolog a Seabornban az általa nyújtott intelligens ábrázolási funkciók, amelyek nemcsak az általa biztosított adatkészletet vizualizálják, hanem regressziós modelleket is építenek köré. Például lehetséges egy lineáris regressziós diagram ábrázolása egyetlen kódsorral. Ennek módja:

sns.lmplot (x = 'Támadás', y = 'Védelem', data = df)

A fenti kódrészlet futtatása után a következő kimenetet látjuk:

Néhány fontos dolgot észrevettünk a fenti kódrészletben:

Ne féljen, ha azt gondolta, hogy nem lehet cselekményünk a regressziós vonal nélkül. Tudunk ! Próbálkozzunk most egy új kódrészlettel, hasonlóan az előzőhöz:

sns.lmplot (x = 'Támadás', y = 'Védelem', data = df, fit_reg = Hamis)

Ezúttal nem látjuk a regressziós vonalat a mi cselekményünkben:

Most ez sokkal egyértelműbb (ha nincs szükségünk a lineáris regressziós vonalra). De ennek még nincs vége. Seaborn lehetővé teszi számunkra, hogy másképp készítsük el ezt a cselekményt, és ezt fogjuk tenni.

Boxdiagramok építése

A Seaborn egyik legnagyobb jellemzője, hogy hogyan fogadja el könnyen a Pandas Dataframes struktúrát az adatok ábrázolásához. Egyszerűen átadhatunk egy Dataframe-et a Seaborn könyvtárnak, hogy az elkészíthessen belőle egy boxplotot:

sns.boxplot (adatok = df)

A fenti kódrészlet futtatása után a következő kimenetet látjuk:

Eltávolíthatjuk az összes első olvasatát, mivel ez kissé kínosnak tűnik, amikor az egyes oszlopokat itt tervezzük:

stats_df = df.csepp (['Összesen'], tengely = 1)
# Új boxplot a stats_df használatával
sns.boxplot (adatok = stats_df)

A fenti kódrészlet futtatása után a következő kimenetet látjuk:

Raj telek Seabornnal

Kialakíthatunk egy intuitív Swarm-cselekményt a Seaborn-nal. Ismét a Pandas adatkeretét fogjuk használni, amelyet korábban betöltöttünk, de ezúttal a Matplotlib show funkcióját hívjuk meg, hogy megmutassuk az elkészített plot. Itt van a kódrészlet:

sns.set_context ("papír")
sns.rajterv (x = "Támadás", y = "Védelem", adatok = df)
plt.előadás()

A fenti kódrészlet futtatása után a következő kimenetet látjuk:

A Seaborn kontextus használatával lehetővé tesszük Seaborn számára, hogy személyre szabott képet és folyékony képet adjon a cselekményhez. Lehetőség van még jobban testre szabni ezt a diagramot az egyedi betűmérettel, amelyet a diagram címkéihez használnak, hogy megkönnyítse az olvasást. Ehhez további paramétereket adunk át a set_context függvénynek, amely ugyanúgy teljesít, mint amilyennek hangzik. Például a címkék betűméretének módosításához fel fogjuk használni a betűtípust.méretparaméter. Itt van a kódrészlet a módosítás elvégzéséhez:

sns.set_context ("papír", font_scale = 3, rc = "betűtípus.méret ": 8", tengelyek.labelsize ": 5)
sns.rajterv (x = "Támadás", y = "Védelem", adatok = df)
plt.előadás()

A fenti kódrészlet futtatása után a következő kimenetet látjuk:

A címke betűméretét megváltoztattuk az általunk megadott paraméterek és a betűtípushoz társított érték alapján.méretparaméter. A Seaborn egyik szakértője, hogy a cselekményt nagyon intuitívvá tegye a gyakorlati használat érdekében, és ez azt jelenti, hogy a Seaborn nemcsak gyakorlati Python csomag, hanem tulajdonképpen valami, amit felhasználhatunk a gyártási telepítések során.

Cím hozzáadása a cselekményekhez

Könnyű címet adni a cselekményeinkhez. Csak egy egyszerű eljárást kell követnünk a tengely szintű függvények használatához, ahol a set_title () úgy működik, ahogy itt a kódrészletben megmutatjuk:

sns.set_context ("papír", font_scale = 3, rc = "betűtípus.méret ": 8", tengelyek.labelsize ": 5)
my_plot = sns.rajterv (x = "Támadás", y = "Védelem", adatok = df)
my_plot.set_title ("LH rajrajz")
plt.előadás()

A fenti kódrészlet futtatása után a következő kimenetet látjuk:

Így sokkal több információt adhatunk a terveinkhez.

Seaborn vs Matplotlib

A lecke példáit megvizsgálva megállapíthatjuk, hogy a Matplotlib és Seaborn nem hasonlítható össze közvetlenül, de egymást kiegészítve tekinthetõk. Az egyik olyan tulajdonság, amely a Seaborn-ot 1 lépéssel előrébb viszi, az a mód, ahogyan Seaborn képes statisztikailag vizualizálni az adatokat.

A Seaborn paramétereinek legjobb kihasználása érdekében javasoljuk, hogy nézze meg a Seaborn dokumentációját, és derítse ki, milyen paramétereket használjon annak érdekében, hogy a telke a lehető legközelebb legyen az üzleti igényekhez.

Következtetés

Ebben a leckében megvizsgáltuk ennek az adatmegjelenítési könyvtárnak a különböző aspektusait, amelyeket a Python segítségével szép és intuitív grafikonok előállításához használhatunk, amelyek az adatokat olyan formában jeleníthetik meg, amelyet az üzleti élet egy platformtól kíván. A Seaborm az egyik legfontosabb vizualizációs könyvtár, amikor az adatfeldolgozásról és az adatok megjelenítéséről a legtöbb vizuális formában van szó, ami feltétlenül olyan képesség, amellyel rendelkeznünk kell az öv alatt, mivel lehetővé teszi számunkra lineáris regressziós modellek felépítését.

Kérjük, ossza meg visszajelzését a leckéről a Twitteren a @sbmaggarwal és a @LinuxHint oldalakon.

A Doom telepítése és lejátszása Linuxon
Bevezetés a Doom-ba A Doom sorozat a 90-es években keletkezett az eredeti Doom megjelenése után. Azonnali sláger volt, és ettől kezdve a játéksorozat ...
Vulkan Linux felhasználók számára
A grafikus kártyák minden új generációjával azt látjuk, hogy a játékfejlesztők átlépik a grafikus hűség határait, és egy lépéssel közelebb kerülnek a ...
OpenTTD vs Simutrans
Saját közlekedési szimuláció létrehozása szórakoztató, pihentető és rendkívül csábító lehet. Ezért meg kell győződnie arról, hogy a lehető legtöbb ját...