Adattudomány

Hogyan lehet Pandas DataFrame-et létrehozni a Pythonban?

Hogyan lehet Pandas DataFrame-et létrehozni a Pythonban?

A Pandas DataFrame egy 2D-s (kétdimenziós) megjegyzésekkel ellátott adatstruktúra, amelyben az adatok táblázatos formában, különböző sorokkal és oszlopokkal vannak igazítva. A könnyebb megértés érdekében a DataFrame úgy működik, mint egy táblázat, amely három különböző összetevőt tartalmaz: indexet, oszlopokat és adatokat. A Panda DataFrames a leggyakoribb módszer a panda objektumainak felhasználására.

A Pandas DataFrames különböző módszerekkel hozható létre. Ez a cikk elmagyarázza az összes lehetséges módszert, amellyel Pandas DataFrame-et hozhat létre a pythonban. Minden példát futtattunk a pycharm eszközön. Indítsuk el egyes módszerek megvalósítását egyenként.

Alapszintaktika

Kövesse a következő szintaxist, miközben DataFrame-eket hoz létre a Pandas pythonban:

pd.DataFrame (Df_data)

Példa: Magyarázzuk meg egy példával. Ebben az esetben a diákok nevének és százalékának adatait a 'Students_Data' változóban tároltuk. Továbbá a pd használatával.DataFrame (), létrehoztunk egy DataFrame-et a diákok eredményének megjelenítésére.

import pandák, mint pd
Diák_adatok =
„Név”: [„Samreena”, „Asif”, „Mahwish”, „Raees”],
'Százalék': [90,80,70,85]
eredmény = pd.DataFrame (Student_Data)
nyomtatás (eredmény)

Módszerek a Panda DataFrame létrehozásához

A Pandas DataFrames különböző módszerekkel hozható létre, amelyeket a cikk további részében tárgyalunk. A hallgatói tanfolyam eredményét DataFrames formájában nyomtatjuk ki. Tehát a következő módszerek egyikével hozhat létre hasonló DataFrame-eket, amelyeket a következő kép képvisel:

01. módszer: Pandas DataFrame létrehozása a listák szótárából

A következő példában a DataFrames a hallgatói tanfolyam eredményeihez kapcsolódó listák szótáraiból jön létre. Először importálja a panda könyvtárát, majd hozzon létre egy listát tartalmazó szótárt. A dict kulcsok jelölik az oszlopneveket, például a „Student_Name”, a „Course_Title” és a „GPA”. A listák az oszlop adatait vagy tartalmát képviselik. A 'dictionary_lists' változó azon hallgatók adatait tartalmazza, amelyek tovább vannak hozzárendelve a 'df1' változóhoz. A nyomtatási utasítás használatával nyomtassa ki a DataFrames teljes tartalmát.

Példa:

# Könyvtárak importálása pandákra és számokra
import pandák, mint pd
# Panda könyvtárának importálása
import pandák, mint pd
# Hozzon létre egy szótárt a listáról
dictionary_lists =
'Student_Name': ['Samreena', 'Raees', 'Sara', 'Sana'],
'Course_Title': ['SQA', 'SRE', 'IT alapjai', 'Mesterséges intelligencia'],
„GPA”: [3.1, 3.3, 2.8., 4. ábra.0]
# Hozza létre a DataFrame-et
dframe = pd.DataFrame (szótár_listák)
nyomtatás (dframe)

A fenti kód végrehajtása után a következő kimenet jelenik meg:

# 02. Módszer: Pandas DataFrame létrehozása a NumPy tömb szótárából

A DataFrame a tömb / lista dict-ből hozható létre. Ebből a célból a hossznak meg kell egyeznie az összes elbeszéléssel. Ha átad valamilyen indexet, akkor az index hosszának meg kell egyeznie a tömb hosszával. Ha egyetlen index sem kerül átadásra, akkor ebben az esetben az alapértelmezett index egy tartomány (n). Itt n a tömb hosszát jelenti.

Példa:

importálja a numpy-t np-ként
# Hozzon létre egy numerikus tömböt
nparray = np.sor(
[['Samreena', 'Raees', 'Sara', 'Sana'],
['SQA', 'SRE', 'IT alapjai', 'Mesterséges intelligencia'],
[3.1, 3.3, 2.8., 4. ábra.0]])
# Hozzon létre egy nparray szótárat
dictionary_of_nparray =
'Student_Name': nparray [0],
'Course_Title': nparray [1],
„GPA”: nparray [2]
# Hozza létre a DataFrame-et
dframe = pd.DataFrame (szótár_neve)
nyomtatás (dframe)

# 03. Módszer: Panda DataFrame létrehozása a listák listájával

A következő kódban minden sor egyetlen sort jelöl.

Példa:

# Könyvtár importálása Pandas pd
import pandák, mint pd
# Készítsen listák listáját
csoport_listák = [
['Samreena', 'SQA', 3.1],
['Raees', 'SRE', 3.3],
['Sara', 'Informatika alapjai', 2.8],
[„Sana”, „Mesterséges intelligencia”, 4.0]]
# Hozza létre a DataFrame-et
dframe = pd.DataFrame (group_lists, oszlopok = ['Student_Name', 'Course_Title', 'GPA'])
nyomtatás (dframe)

# 04. Módszer: Panda DataFrame létrehozása a szótár listája segítségével

A következő kódban minden szótár egyetlen sort és gombokat képvisel, amelyek az oszlopneveket jelentik.

Példa:

# Könyvtári pandák importálása
import pandák, mint pd
# Készítsen listát a szótárakról
dict_list = [
'Student_Name': 'Samreena', 'Course_Title': 'SQA', 'GPA': 3.1,
'Student_Name': 'Raees', 'Course_Title': 'SRE', 'GPA': 3.3,
'Student_Name': 'Sara', 'Course_Title': 'Informatika alapjai', 'GPA': 2.8,
'Student_Name': 'Sana', 'Course_Title': 'Mesterséges intelligencia', 'GPA': 4.0]
# Hozza létre a DataFrame-et
dframe = pd.DataFrame (dict_list)
nyomtatás (dframe)

# 05. Módszer: Pandák létrehozása Dataframe a pandák sorozatából

A dict billentyűk az oszlopok nevét, az egyes sorok pedig az oszlopok tartalmát jelentik. A következő kódsorokban háromféle sorozatot vettünk fel: Name_series, Course_series és GPA_series.

Példa:

# Könyvtári pandák importálása
import pandák, mint pd
# Készítse el a tanulónevek sorozatát
Név_sorozat = pd.Sorozat (['Samreena', 'Raees', 'Sara', 'Sana'])
Tanfolyam_sorozat = pd.Sorozat (['SQA', 'SRE', 'IT alapjai', 'Mesterséges intelligencia'])
GPA_sorozat = pd.Sorozat ([3.1, 3.3, 2.8., 4. ábra.0])
# Hozzon létre egy sorozatszótárt
szókincs_szótár
\
'] = ' Név ': Név_sorozat,' Kor ': Tanfolyam_sorozat,' Osztály ': GPA_sorozat
# DataFrame létrehozása
dframe = pd.DataFrame (szótár_neve)
nyomtatás (dframe)

# 06. Módszer: Pandas DataFrame létrehozása a zip () függvény használatával.

Különböző listák egyesíthetők a list (zip ()) függvény segítségével. A következő példában a pandas DataFrame a pd hívásával jön létre.DataFrame () függvény. Három különböző lista jön létre, amelyek egyesülnek sorok formájában.

Példa:

import pandák, mint pd
# Lista1
Student_Name = ['Samreena', 'Raees', 'Sara', 'Sana']
# Lista2
Course_Title = ['SQA', 'SRE', 'Informatika alapjai', 'Mesterséges intelligencia']
# Lista3
GPA = [3.1, 3.3, 2.8., 4. ábra.0]
# Vegyük tovább a listák három listáját, egyesítsük őket a zip () használatával.
tuples = list (zip (Student_Name, Course_Title, GPA))
# Adatértékek hozzárendelése a sorrendekhez.
tüllök
# Tolllista konvertálása pandákra Dataframe-re.
dframe = pd.DataFrame (sorok, oszlopok = ['Student_Name', 'Course_Title', 'GPA'])
# Adatok nyomtatása.
nyomtatás (dframe)

Következtetés

A fenti módszerek használatával Pandas DataFrame-eket hozhat létre a pythonban. A Pandas DataFrames létrehozásával kinyomtattunk egy hallgatói GPA tanfolyamot. Remélhetőleg hasznos eredményeket fog elérni a fent említett példák futtatása után. A jobb megértés érdekében az összes program jól meg van kommentálva. Ha több módja van a Pandas DataFrame-ek létrehozására, ne habozzon megosztani velünk. Köszönjük, hogy elolvasta ezt az oktatóanyagot.

A legjobb Gamepad Mapping alkalmazások Linuxhoz
Ha egy tipikus billentyűzet és egér beviteli rendszer helyett szeretnél játékokat játszani Linuxon egy játékvezérlővel, van néhány hasznos alkalmazás ...
Hasznos eszközök Linux játékosok számára
Ha szeretsz Linuxon játszani, akkor valószínű, hogy olyan alkalmazásokat és segédprogramokat használtál, mint a Wine, a Lutris és az OBS Studio a játé...
HD Remastered Games for Linux, amelyeknek soha nem volt korábban Linux kiadásuk
Számos játékfejlesztő és kiadó a régi játékok HD remasterjével áll elő a franchise élettartamának meghosszabbítása érdekében. Kérjük, hogy a rajongók ...