- Mi az a Python Seaborn?
- A telkek típusai, amelyeket Seabornnal megalkothatunk
- Több telek használata
- Néhány alternatíva a Python Seaborn számára
Úgy tűnik, hogy sokat kell fedezni. Kezdjük most.
Mi az a Python Seaborn könyvtár?
A Seaborn könyvtár egy Python csomag, amely lehetővé teszi számunkra, hogy statisztikai adatok alapján infografikákat készítsünk. Mivel a matplotlib tetején készül, tehát eredendően kompatibilis vele. Ezenkívül támogatja a NumPy és a Pandas adatstruktúrát, így a rajzolást közvetlenül ezekből a gyűjteményekből lehet elvégezni.
A komplex adatok megjelenítése az egyik legfontosabb dolog, amit Seaborn gondoz. Ha a Matplotlibet hasonlítanánk a Seabornhoz, akkor Seaborn képes könnyebbé tenni azokat a dolgokat, amelyeket nehéz elérni a Matplotlib segítségével. Fontos azonban megjegyezni, hogy A Seaborn nem a Matplotlib alternatívája, hanem annak kiegészítője. A lecke során a Matplotlib függvényeket is felhasználjuk a kódrészletekben. Ön a következő felhasználási esetekben választja ki a Seaborn használatát:
- Önnek statisztikai idősoradatait kell ábrázolnia a bizonytalanság ábrázolásával
- Vizuálisan megállapítani a két adathalmaz közötti különbséget
- Az egy- és kétváltozós eloszlások vizualizálása
- Sokkal több vizuális vonzódás hozzáadása a sok beépített témával rendelkező matplotlib plotokhoz
- A gépi tanulási modellek illesztése és vizualizálása lineáris regresszió útján független és függő változókkal
Csak egy megjegyzés a kezdés előtt: virtuális környezetet használunk ehhez a leckéhez, amelyet a következő paranccsal készítettünk:
python -m virtualenv tengeri születésűforrás tengeri születésű / bin / aktiválás
Amint a virtuális környezet aktív, telepíthetjük a Seaborn könyvtárat a virtuális env-be, hogy a következő módon létrehozott példák végrehajthatók legyenek:
pip telepíteni tengeri születésűHasználhatja az Anaconda-t is ezeknek a példáknak a futtatásához, ami könnyebb. Ha telepíteni szeretné a számítógépére, nézze meg a „Hogyan telepítsük az Anaconda Python-ot az Ubuntu 18-ra” című leckét.04 LTS ”, és ossza meg visszajelzését. Most térjünk át a különféle típusú parcellákra, amelyeket a Python Seaborn segítségével lehet megalkotni.
A Pokemon adatkészlet használata
A lecke gyakorlati megőrzéséhez Pokemon adatkészletet fogunk használni, amely letölthető a Kaggle-ről. Ennek az adatkészletnek a programunkba történő importálásához a Pandas könyvtárat fogjuk használni. Itt található az összes import, amelyet a programunkban végrehajtunk:
import pandák, mint pda matplotlib import pyplot-tól plt-ként
import tengeri születésű, mint sns
Most importálhatjuk az adatkészletet a programunkba, és a Panda mintadatainak egy részét megjeleníthetjük a következőképpen:
df = pd.read_csv ('Pokemon.csv ', index_col = 0)df.fej()
Vegye figyelembe, hogy a fenti kódrészlet futtatásához a CSV-adatkészletnek ugyanabban a könyvtárban kell lennie, mint maga a program. Miután futtattuk a fenti kódrészletet, a következő kimenetet látjuk (Anaconda Jupyter jegyzetfüzetében):
Lineáris regressziós görbe ábrázolása
Az egyik legjobb dolog a Seabornban az általa nyújtott intelligens ábrázolási funkciók, amelyek nemcsak az általa biztosított adatkészletet vizualizálják, hanem regressziós modelleket is építenek köré. Például lehetséges egy lineáris regressziós diagram ábrázolása egyetlen kódsorral. Ennek módja:
sns.lmplot (x = 'Támadás', y = 'Védelem', data = df)A fenti kódrészlet futtatása után a következő kimenetet látjuk:
Néhány fontos dolgot észrevettünk a fenti kódrészletben:
- A Seaborn-ban külön nyomtatási funkció áll rendelkezésre
- A Seaborn illesztési és ábrázolási funkcióját használtuk, amely egy lineáris regressziós vonalat biztosított számunkra, amelyet maga modellezett
Ne féljen, ha azt gondolta, hogy nem lehet cselekményünk a regressziós vonal nélkül. Tudunk ! Próbálkozzunk most egy új kódrészlettel, hasonlóan az előzőhöz:
sns.lmplot (x = 'Támadás', y = 'Védelem', data = df, fit_reg = Hamis)Ezúttal nem látjuk a regressziós vonalat a mi cselekményünkben:
Most ez sokkal egyértelműbb (ha nincs szükségünk a lineáris regressziós vonalra). De ennek még nincs vége. Seaborn lehetővé teszi számunkra, hogy másképp készítsük el ezt a cselekményt, és ezt fogjuk tenni.
Boxdiagramok építése
A Seaborn egyik legnagyobb jellemzője, hogy hogyan fogadja el könnyen a Pandas Dataframes struktúrát az adatok ábrázolásához. Egyszerűen átadhatunk egy Dataframe-et a Seaborn könyvtárnak, hogy az elkészíthessen belőle egy boxplotot:
sns.boxplot (adatok = df)A fenti kódrészlet futtatása után a következő kimenetet látjuk:
Eltávolíthatjuk az összes első olvasatát, mivel ez kissé kínosnak tűnik, amikor az egyes oszlopokat itt tervezzük:
# Új boxplot a stats_df használatával
sns.boxplot (adatok = stats_df)
A fenti kódrészlet futtatása után a következő kimenetet látjuk:
Raj telek Seabornnal
Kialakíthatunk egy intuitív Swarm-cselekményt a Seaborn-nal. Ismét a Pandas adatkeretét fogjuk használni, amelyet korábban betöltöttünk, de ezúttal a Matplotlib show funkcióját hívjuk meg, hogy megmutassuk az elkészített plot. Itt van a kódrészlet:
sns.set_context ("papír")sns.rajterv (x = "Támadás", y = "Védelem", adatok = df)
plt.előadás()
A fenti kódrészlet futtatása után a következő kimenetet látjuk:
A Seaborn kontextus használatával lehetővé tesszük Seaborn számára, hogy személyre szabott képet és folyékony képet adjon a cselekményhez. Lehetőség van még jobban testre szabni ezt a diagramot az egyedi betűmérettel, amelyet a diagram címkéihez használnak, hogy megkönnyítse az olvasást. Ehhez további paramétereket adunk át a set_context függvénynek, amely ugyanúgy teljesít, mint amilyennek hangzik. Például a címkék betűméretének módosításához fel fogjuk használni a betűtípust.méretparaméter. Itt van a kódrészlet a módosítás elvégzéséhez:
sns.rajterv (x = "Támadás", y = "Védelem", adatok = df)
plt.előadás()
A fenti kódrészlet futtatása után a következő kimenetet látjuk:
A címke betűméretét megváltoztattuk az általunk megadott paraméterek és a betűtípushoz társított érték alapján.méretparaméter. A Seaborn egyik szakértője, hogy a cselekményt nagyon intuitívvá tegye a gyakorlati használat érdekében, és ez azt jelenti, hogy a Seaborn nemcsak gyakorlati Python csomag, hanem tulajdonképpen valami, amit felhasználhatunk a gyártási telepítések során.
Cím hozzáadása a cselekményekhez
Könnyű címet adni a cselekményeinkhez. Csak egy egyszerű eljárást kell követnünk a tengely szintű függvények használatához, ahol a set_title () úgy működik, ahogy itt a kódrészletben megmutatjuk:
sns.set_context ("papír", font_scale = 3, rc = "betűtípus.méret ": 8", tengelyek.labelsize ": 5)my_plot = sns.rajterv (x = "Támadás", y = "Védelem", adatok = df)
my_plot.set_title ("LH rajrajz")
plt.előadás()
A fenti kódrészlet futtatása után a következő kimenetet látjuk:
Így sokkal több információt adhatunk a terveinkhez.
Seaborn vs Matplotlib
A lecke példáit megvizsgálva megállapíthatjuk, hogy a Matplotlib és Seaborn nem hasonlítható össze közvetlenül, de egymást kiegészítve tekinthetõk. Az egyik olyan tulajdonság, amely a Seaborn-ot 1 lépéssel előrébb viszi, az a mód, ahogyan Seaborn képes statisztikailag vizualizálni az adatokat.
A Seaborn paramétereinek legjobb kihasználása érdekében javasoljuk, hogy nézze meg a Seaborn dokumentációját, és derítse ki, milyen paramétereket használjon annak érdekében, hogy a telke a lehető legközelebb legyen az üzleti igényekhez.
Következtetés
Ebben a leckében megvizsgáltuk ennek az adatmegjelenítési könyvtárnak a különböző aspektusait, amelyeket a Python segítségével szép és intuitív grafikonok előállításához használhatunk, amelyek az adatokat olyan formában jeleníthetik meg, amelyet az üzleti élet egy platformtól kíván. A Seaborm az egyik legfontosabb vizualizációs könyvtár, amikor az adatfeldolgozásról és az adatok megjelenítéséről a legtöbb vizuális formában van szó, ami feltétlenül olyan képesség, amellyel rendelkeznünk kell az öv alatt, mivel lehetővé teszi számunkra lineáris regressziós modellek felépítését.
Kérjük, ossza meg visszajelzését a leckéről a Twitteren a @sbmaggarwal és a @LinuxHint oldalakon.