R

R programozási bemutató

R programozási bemutató
Gyorsan szeretne kezdőtől szakértővé válni az R programozónak? Az R az egyik legjobb programozási nyelv a statisztikával, a matematikával és az adattudománnyal kapcsolatos munkához. Ez az oktatóanyag segít megtanulni az R-t és elkészíteni az első gépi tanulási modellt. Kezdjük el.

Az R lefordítása és futtatása a parancssorból

Az R programok futtatásának két módja: egy széles körben használt és legelőnyösebb R szkript, a második pedig az R CMD BATCH, ez nem általánosan használt parancs. Hívhatjuk őket közvetlenül a parancssorból vagy bármely más jobütemezőből.

Elképzelhető, hogy ezeket a parancsokat az IDE-be épített héjból hívhatja meg, és manapság az RStudio IDE olyan eszközöket tartalmaz, amelyek továbbfejlesztik vagy kezelik az R szkriptet és az R CMD BATCH funkciókat.

Az R (belül) forrás () függvény jó alternatíva a parancssor használatához. Ez a függvény meghívhat egy szkriptet is, de a funkció használatához az R környezetben kell lennie.

R Nyelvi beépített adatkészletek

Az R-vel beépített adatkészletek felsorolásához használja a data () parancsot, majd keresse meg a kívánt elemet, és használja az adatkészlet nevét az data () függvényben. Hasonló adatok (függvénynév).

Adathalmazok megjelenítése R-ben

A kérdőjel (?) segítségével segítséget lehet kérni az adatkészletekhez.

Minden ellenőrzéséhez használja az összefoglalót ().

A Plot () egy olyan függvény is, amelyet grafikonok ábrázolására használnak.

Hozzunk létre egy teszt szkriptet, és futtassuk. Teremt p1.R fájlt, és mentse el a saját könyvtárba a következő tartalommal:

Kódpélda:

 # Egyszerű hello world kód R betűvel ("Hello World!") print (" LinuxHint ") print (5 + 6) 

A Hello World futása

R Adatkeretek

Az adatok táblákba való tárolásához az R nevű a nevű struktúrát használjuk Adatkeret. Egyforma hosszúságú vektorok felsorolására szolgál. Például a következő változó nm egy adatkeret, amely három x, y, z vektort tartalmaz:

x = c (2, 3, 5) y = c ("aa", "bb", "cc") z = c (IGAZ, HAMIS, IGAZ) # nm egy adatkeret nm = adat.keret (n, s, b) 

Van egy úgynevezett fogalom BeépítettAdatkeretek R-ben is. mtcars az egyik ilyen beépített adatkeret az R-ben, amelyet példaként fogunk használni a jobb megértésünk érdekében. Lásd az alábbi kódot:

 > mtcars mpg cyl disp hp drat wt… Mazda RX4 21.0 6 160 110 3.90 2.62… busz RX4 Wag 21.0 6 160 110 3.90 2.88… Datsun 710 22.8 4 108 93 3.85 2.32… 

mtcars bulitin adatkeret

A fejléc az oszlopneveket tartalmazó táblázat felső sora. Az adatsorokat minden vízszintes vonal adományozza; minden sor a sor nevével kezdődik, majd a tényleges adatok következnek. A sor adattagját cellának nevezzük.

A sor- és oszlopkoordinátákat egyetlen szögletes zárójelben lévő „[]” operátorba írnánk be, hogy adatokat kapjunk egy cellában. A koordináták elválasztásához vesszőt használunk. A sorrend elengedhetetlen. A koordináta sorral, majd vesszővel kezdődik, majd az oszloppal végződik. A cella értéke 2nd sor és 1utca oszlop a következőképpen van megadva:

 > mtcars [2, 2] [1] 6 

A koordináták helyett használhatunk sor- és oszlopnevet is:

 > mtcars ["Bus RX4", "mpg"] [1] 6 

a nrow függvény segítségével meg lehet találni az adatkeret sorainak számát.

 > nrow (mtcars) # adatsor száma [1] 32 

Az ncol függvény segítségével meg lehet keresni az oszlopok számát egy adatkeretben.

 > ncol (mtcars) # oszlopok száma [1] 11 

R Programozási hurkok

Bizonyos feltételek mellett ciklusokat használunk, amikor automatizálni akarjuk a kód egy részét, vagy meg akarjuk ismételni az utasítások sorozatát.

Az R hurokhoz

Ha egyszerre több információt akarunk kinyomtatni ezekről az évekről.

 nyomtatás (beillesztés ("Az év van", 2000)) "Az év 2000" nyomtatás (beillesztés ("Az év van", 2001)) "Az év 2001" nyomtatás (beillesztés ("Az év van", 2002) ) "Az év 2002" nyomtatás (beillesztés ("Az év van", 2003)) "Az év 2003" nyomtatás (beillesztés ("Az év van", 2004)) "Az év 2004" nyomtatás (beillesztés (" Az év ", 2005))" Az év 2005 " 

Ahelyett, hogy újra és újra megismételnénk állításunkat, ha használjuk mert hurok sokkal könnyebb lesz nekünk. Mint ez:

 for (év c-ben (2000,2001,2002,2003,2004,2005)) print (beillesztés ("Az év", év)) "" Az év 2000 "" Az év 2001 "" Az év 2002 "" Az év 2003 "" Az év 2004 "" Az év 2005 " 

Míg hurok R-ben

 while (kifejezés) utasítás 

Ha a kifejezés eredménye IGAZ, akkor a hurok törzse kerül beírásra. A cikluson belüli utasítások végrehajtásra kerülnek, és az áramlás visszatér, hogy újra értékelje a kifejezést. A hurok addig ismételgeti magát, amíg a kifejezés FALSE értékre nem válik, ebben az esetben a hurok kilép.

Példa a while hurokra:

 # i kezdetben inicializálva van 0 i = 0, míg (i<5)  print (i) i=i+1  Output: 0 1 2 3 4 

A fenti while ciklusban a kifejezés az én<5amely igaz, mivel 0 értéke kisebb, mint 5. Ezért a hurok teste végrehajtásra kerül, és én kimenet és növekmény. Fontos a növekmény én a hurok belsejében, tehát valamikor valahogy teljesíteni fogja a feltételt. A következő ciklusban a én értéke 1, és a hurok folytatódik. -Ig megismétli magát én egyenlő 5-vel, ha az 5. feltétel<5 reached loop will give FALSE and the while loop will exit.

R Funkciók

A funkció direktív függvényt használunk (). Pontosabban, ezek az osztály R objektumai funkció.

f <- function()  ##some piece of instructions  

Nevezetesen, a függvényeket át lehet adni más függvényeknek, mivel argumentumokat és függvényeket be lehet ágyazni, hogy meghatározhassunk egy függvényt egy másik függvény belsejében.

A függvények opcionálisan tartalmazhatnak megnevezett argumentumokat, amelyek alapértelmezett értékekkel rendelkeznek. Ha nem akar alapértelmezett értéket, akkor annak értékét NULL értékre állíthatja.

Néhány tény az R Function argumentumokkal kapcsolatban:

# Funkció meghatározása: f <- function (x, y = 1, z = 2, s= NULL)   

Logisztikai regressziós modell készítése beépített adatsorral

A glm () függvényt használjuk R-ben a logisztikai regresszió illesztésére. A glm () függvény hasonló az lm () -hez, de a glm () rendelkezik néhány további paraméterrel. Formátuma így néz ki:

 glm (X ~ Z1 + Z2 + Z3, family = binomiális (link = ”logit”), data = mydata) 

X függ Z1, Z2 és Z3 értékeitől. Ami azt jelenti, hogy Z1, Z2 és Z3 független változók, és X az függő függvény. A függvény extra paramétercsaládot tartalmaz, és binomiális értéke van (link = „logit”), ami azt jelenti, hogy a link függvény logit, a regressziós modell valószínűségi eloszlása ​​pedig binomiális.

Tegyük fel, hogy van egy példánk a hallgatóra, ahol két vizsgaeredmény alapján felvételt kap. Az adatkészlet a következő elemeket tartalmazza:

A legjobb Linux-disztribútorok játékhoz 2021-ben
A Linux operációs rendszer hosszú utat tett meg eredeti, egyszerű, szerver alapú kinézetétől. Ez az operációs rendszer rendkívül javult az elmúlt évek...
Hogyan lehet rögzíteni és streamelni a játékmenetét Linuxon
Korábban a játékokat csak hobbinak tekintették, de az idő múlásával a játékipar hatalmas növekedést ért el a technológia és a játékosok száma szempont...
A legjobb játékok kézi követéssel
Az Oculus Quest nemrégiben bemutatta a vezérlés nélküli kézi követés nagyszerű ötletét. Az egyre növekvő számú játékkal és tevékenységgel, amelyek tám...