Üres adatkeret létrehozása R

Ures Adatkeret Letrehozasa R



Egy üres DataFrame létrehozása R-ben előnyös lehet, ha azt a későbbiekben adatokkal akarjuk feltölteni. Az R-ben egy üres DataFrame-nek általában 0 sora és 0 oszlopa van. Egy üres DataFrame azonban néha sorok nélküli DataFrame is lehet, de már meghatározott oszlopokkal. A data.frame() függvény segítségével létrehozhatunk egy üres DataFrame-et R-ben megadott oszlopokkal. Különféle megközelítések léteznek az üres adatkeret létrehozására R-ben. Ebben a cikkben az üres DataFrame létrehozásának módjait vizsgáljuk meg R-ben.

1. példa: Üres DataFrame létrehozása R-ben

Az üres DataFrame létrehozásának legalapvetőbb módja az R-ben a data.frame() metódus használata.

üres_df < - data.frame ( )
nyomtatás ( üres_df )
homályos ( üres_df )

Az R adott kódjában létrehozunk egy data.frame() függvényt az üres_df-en belül. A data.frame() függvény nem vesz fel argumentumokat, így sorok és oszlopok nélküli adatkeretet hoz létre. Amikor a print() függvény segítségével kinyomtatjuk az üres_df-et, az üres DataFrame kimenetét kapjuk. Ezután adjuk át az üres_df-et a dim() függvényben, hogy megkapjuk az adatkeret dimenzióit két értékkel rendelkező vektorként: a sorok számával, illetve az oszlopok számával.







Ezért az eredmény először azt az üzenetet jeleníti meg, hogy a DataFrame-nek „0” oszlopai és „0” sorai vannak. Ezenkívül két nullából álló vektort kapunk, mivel a DataFrame-nek nulla sora és nulla oszlopa van.





2. példa: Üres adatkeret létrehozása „0” oszloppal és sorral az R-ben

Az üres DataFrame létrehozásának másik módja a mátrix() függvény használata, majd a DataFrame-mé való konvertálása. Mint ilyen, mind a mátrix, mind a DataFrame függvények átkonvertálhatók.





m1 = mátrix ( ncol = 0 , nrow = 0 )
m1 = mátrix ( ncol = 0 , nrow = 0 )
df =data.frame ( m1 )
nyomtatás ( 'Üres adatkeret' )
nyomtatás ( df )
nyomtatás ( 'Adatkeret méretei' )
homályos ( df )

Az R adott kódjában először a matrix() függvényt hívjuk meg az „m1”-ben, majd az „ncol” és „nrow” paraméterek átadásával definiáljuk a mátrix()-t. Az ezekhez a paraméterekhez rendelt érték „0”. Ezt követően a data.frame() függvény segítségével konvertáljuk az „m1”-et DataFrame-be. A konvertált DataFrame eredményét a nyomtatási funkció segítségével nyomtatja ki. A dim() függvény használatával a DataFrame méretei is megjelennek.

Így a kimenet az üres adatkeret üzenetét és a DataFrame nulla vektor dimenzióit jelenti egy üres mátrix miatt.



3. példa: Üres adatkeret létrehozása N oszloppal az R-ben

Ezenkívül üres DataFrame-et is létrehozhatunk, ha megadjuk az oszlop nevét a c() függvény segítségével. Tekintsük az R következő kódját:

cols = c ( 'név' , 'kor' , 'jelek' )
df = adat.keret ( mátrix ( nrow = 0 , ncol = hossz ( cols ) ) )
colnames ( df ) = oszlopok
nyomtatás ( df )

A c() függvényt a „cols” karaktervektorban hívjuk. Itt a c() függvény három oszlopnévvel van megadva. Ezt követően létrehozunk egy üres mátrixot 0 sorral és ugyanannyi oszloppal, amennyi a data.frame() függvényen belül meghívott matrix() függvényen belül a cols vektor hossza.

Az „nrow”-t 0 értékkel adjuk át, hogy üres mátrixot hozzunk létre. Az „ncol” a long(cols) értékkel van megadva, hogy egy mátrixot hozzon létre, amelynek az oszlopok száma megegyezik a „cols” vektor hosszával. Ezután a „colnames()” függvény és a „cols” vektor segítségével hozzárendeljük az oszlopneveket az adatkerethez.

Amint látjuk, az üres adatkeret három oszlopnévvel a következő:

4. példa: Üres adatkeret létrehozása az R oszlopaihoz rendelt üres vektorral

A korábbi megközelítések mellett üres DataFrame-et is létrehozhatunk az üres vektorok oszlopokhoz való megadásával és a sorok kizárásával. Ennek eléréséhez összpontosítsunk a következő R kódra:

df < - data.frame ( c1 = dupla ( ) ,
c2 = egész szám ( ) ,
c3 = tényező ( ) ,
c4 = logikai ( ) ,
c5 = karakter ( ) ,
stringsAsFactors = FALSE )
str ( df )

Először deklaráljuk a data.frame() függvényt. Ezután meghatározzuk a különböző adattípusokat a különböző oszlopokhoz. Vegye figyelembe, hogy nem adunk át argumentumot ezeknek az adattípus-függvényeknek az üres oszlopok létrehozásához, amelyekben nincsenek értékek.

Ezenkívül a „stringsAsFactors” FALSE értékre van állítva, hogy megakadályozza, hogy R automatikusan faktorokká alakítsa át a karakteroszlopokat. Ezután az str() függvénnyel kinyomtatjuk a „df” adatkeret szerkezetét, amely tartalmazza az egyes oszlopok adattípusait és az adatkeretben lévő sorok számát.

Az eredményül kapott kimenet az üres adatkeret alatt jelenik meg, öt különböző adattípusú oszloppal, sorok nélkül.

5. példa: Üres DataFrame létrehozása egy meglévőből az R-ben

Ezzel szemben, ha van egy meglévő DataFrame-ünk, akkor kiüríthetjük az üres DataFrame létrehozásához. Ehhez a következő kódot adjuk meg R-ben:

df < - data.frame (
Sno =c ( 1 , 2 , 3 , 4 ) ,
neveket =c ( 'Alex' , 'Candice' , 'Jimmy' , 'Sötét' ) ,
kor =c ( huszonegy , 24 , 25 , 26 )
)
emp_df = df [ HAMIS, ]
emp_df

Meghatározzuk a DataFrame-et, amely különböző oszlopneveket vesz fel különböző típusú értékekkel. Lényeges, hogy a „df” adatkeret itt négy adatsort tartalmaz. Ezt követően deklarálunk egy új adatkeretet, amely „emp_df” a FALSE logikai index segítségével. Ez az index nem választ ki sorokat a „df”-ből. Ezért az „emp_df” DataFrame ugyanazokkal az oszlopnevekkel és adattípusokkal rendelkezik, mint a „df”.

A következő kimenet megjeleníti az adatkeret oszlopait, adattípusait, valamint a sorok számát. Mivel az adatkeretben nulla sor van, a nulla értékkel rendelkező sorokat jeleníti meg:

6. példa: Üres adatkeret létrehozása a Structure() metódussal az R-ben

Hatékonyan használhatjuk a structure() metódust üres adatkeret létrehozására. Ez a funkció részleteket ad egy bizonyos objektumról, speciális jellemzőkkel. Nézze meg az R következő kódját, amely egy üres adatkeretet hoz létre a structure() függvény segítségével:

df < - szerkezet ( lista ( név = karakter ( ) ,
hely = karakter ( ) ,
dátum = mint.Dátum ( karakter ( ) ) ) ,
osztály = 'data.frame' )
str ( df )

Megadjuk azoknak az oszlopoknak a nevét, amelyek a karakter() és az as.Date(character()) karaktereket tartalmazzák, hogy üres karaktert és dátumvektort hozzunk létre. Ezek az oszlopok a list() függvényen belül kerülnek átadásra, amely megadja az oszlopok kezdeti értékeit. A structure() függvény itt az adatkeret létrehozására és a 'data.frame' osztályhoz való hozzárendelésére szolgál.

A következő kimenet a 0 megfigyelést és 3 változót tartalmazó adatkeretet képviseli, és megadja az egyes változók nevét és adattípusát:

Következtetés

A data.frame() függvény az összes megadott példában az üres DataFrame létrehozására szolgál. Először a data.frame() függvényt használtuk paraméterek nélkül egy üres DataFrame-hez. Ezután létrehoztunk egy üres DataFrame-et úgy, hogy a sorokat és oszlopokat nulla értékkel adtuk meg. Megadtuk továbbá az értékkel rendelkező oszlopokat, a sorokat pedig nullával, csak az értékeket tartalmazó oszlopokat és a 0 sorokat, és az üres vektort használtuk. Végül létrehoztuk az üres DataFrame-et a structure() függvény segítségével.