Sample() függvény R-ben

Sample Fuggveny R Ben



Az R-ben véletlenszerűen mintaértékeket kapunk egy vektorból vagy egy listából a sample() függvény segítségével. Lehetővé teszi számunkra, hogy véletlenszerűen válasszuk ki az adatok egy részét, amely számos statisztikai alkalmazásban hasznos. Ha a bemenet egy lista a sample() függvényben, akkor a kimenet is egy lista lesz ugyanannyi elemmel, de a kiválasztott elemekkel. Ez a cikk bemutatja az R minta() függvényét a különböző argumentumokat beállító implementációval.

1. példa: A Sample() függvény használata az adatargumentummal

Az R minta() függvényét a mintaadatokkal együtt kell ellátni egy szám véletlenszerű generálásához. A mintaadat a sample() függvény szükséges argumentuma, amelynek kódja a következő:

adatokX < - c ( 10 , húsz , 30 , 40 , ötven , 60 , 70 , 80 , 90 , 100 )

minta ( adatokX , 3 )

minta ( adatokX , 3 )

Itt először generáljuk a „dataX” változón belüli egész elemek vektorait. Ezután kétszer meghívjuk a minta() függvényt a kódban, és átadjuk neki a korábban generált „dataX” vektort argumentumként. A minta (dataX, 3) első használata három elemből álló véletlenszerű mintát vesz a „dataX” vektorból. Az eredmény a „dataX” három elemének véletlenszerű permutációja. Ezután ismét az (a, 5) mintát használjuk, amely egy másik független véletlenszerű mintát vesz három elemből a „dataX” vektorból. Ezúttal az eredmény teljesen eltér az előzőtől.







A kimenet a sample() függvény kétszeri meghívásakor mutatja meg a különböző elemeket. Vegye figyelembe, hogy minden alkalommal, amikor véletlenszerűen hozzuk létre a mintát, a vektorokból különböző elemeket kapunk:





2. példa: A Sample() függvény használata a Csere argumentummal

Továbbá megvan a minta() függvény „csere” argumentuma, amely a logikai értékeket veszi fel. Egy hasonló elem többször is kiválasztható, ha az elem mintavételezése a helyettesítési opcióval, TRUE. Ha azonban az érték FALSE-ra van állítva, akkor minden elemből csak egy választható lehet, ami az elemek mintavételezését eredményezi csere nélkül.





véletlen_számok = c ( tizenegy , 25 , 12 , 89 , Négy öt , 16 , 67 , 38 , 96 , 55 , 73 )

minta ( véletlen_számok , 4 , cserélje ki = IGAZ )

minta ( véletlen_számok , 5 , cserélje ki = IGAZ )

Itt először definiáljuk a vektort néhány numerikus értékkel a „random_numbers” változóban. Ezt követően meghívjuk a sample() függvényt, ahol a „random_numbers” argumentumként kerül átadásra. A „4” érték a sample() függvényben van megadva, ami azt jelzi, hogy csak négy véletlenszerű értéket választ ki a „random_numbers” vektorokból.

Ezután a sample() függvényben a change=TRUE azt határozza meg, hogy minden érték többször is kiválasztható. Ezután ismét üzembe helyezzük a sample() függvényt, amely ezúttal „5” véletlenszerű értéket választ ki a vektorokból. Hasonlóképpen a helyettesítő argumentumot „TRUE”-re állítjuk be, mint korábban az egyes értékek többszörös kiválasztási opcióinál.



Amint látjuk, az első kimenet 4 véletlenszerűen kiválasztott elem vektorát jeleníti meg a „random_numbers” vektorból. A következő kimenet azonban egy „5” véletlenszerűen kiválasztott elemből álló vektort jelenít meg:

3. példa: A Sample() függvény használata a méret argumentummal

A következő argumentum, amelyet a sample() függvény átenged, a „size”. A „size” egy opcionális paraméter, amely a minták értékét jelzi. A minta() függvény kódja a „size” paraméterrel az alábbiakban található:

vektorok < - 1 : 10

minta ( vektorok , méret = 5 )

Itt a numerikus vektort a „vectors” változóban 1 és 10 közötti egész számok sorozataként határozzuk meg. A minta() függvényt ezután a vektorból véletlenszerű elemek kiválasztására használják. Amint látjuk, a sample() függvénynek két argumentuma van. Az első argumentum a vektorok, amelyekből a mintát kapjuk. A következő argumentum az „5” értékkel megadott méret, ami azt jelzi, hogy csak öt elemet kell kiválasztani a vektorból.

Ezért a kiválasztott elemek véletlen sorrendben, új vektorként jelennek meg a következő kimenetben:

4. példa: A Sample() függvény használata az R listához

Ezenkívül a sample() függvény használható az R-beli listához. A példa ezen része véletlenszerű értékeket kap a listából.

R_list < - lista ( 1 : 4 ,

913 ,

c ( 'X' , 'ÉÉÉ' , 'JÓ' ) ,

'ZZZ' ,

5 )

eredmény < - R_list [ minta ( 1 :hossz ( R_list ) , méret = 4 ) ]

eredmény

Itt az „R_list” listája különböző típusú elemekkel van definiálva, beleértve egy numerikus vektort, egy számot, egy karaktervektort, egy karakterláncot és egy másik számot. Ezt követően létrehozunk egy „eredmény” változót, ahol a sample() függvény meghívásra kerül.

A sample() függvényen belül beállítjuk az „1:length(R_list)” kifejezést, amely jelzi az indexek vektorait, amelyeken keresztül mintát kell venni. Ezután van egy „size” argumentum a mintavételezendő elemek számának megadására, amely „4”. Ezért az „R_list” három véletlenszerűen kiválasztott elemet generál az „R_list” listából. Mivel az „R_list” listában szereplő elemek különböző típusúak, az „eredmény”-ben kapott elemek is különböző típusúak lehetnek.

A kimenet az új listát jelenti, amely az eredeti lista véletlenszerű részhalmazát tartalmazza:

5. példa: A Sample() függvény használata a Prob argumentummal

Ezenkívül a minta() függvény „prob” paraméterével rendelkezünk. A „prob” argumentum a kiválasztott elem valószínűségét adja meg a vektorban. Ne feledje, hogy minden elem azonos valószínűségűnek tekinthető, ha a „prob” argumentumot nem használja.

adataim = c ( 31 , 99 , 5 , 24 , 72 )

minta ( adataim , méret = 10 , cserélje ki = IGAZ ,

prob = c ( 0.5 , ismétlés ( 0.1 , 4 ) ) )

Itt a numerikus vektorok elemeit a „saját_adat”-nak nevezzük. A következő lépésben meghívjuk a minta() függvényt, ahol a „my_data” átadásra kerül belőle véletlenszerűen kiválasztott 10 elemnek. Ezután meghatározásra kerül a „size” argumentum, amely meghatározza, hogy a véletlenszerűen kiválasztandó érték „10” méretű legyen. Ezt követően a „replace” argumentumhoz „TRUE”-t rendelünk, ami azt jelenti, hogy minden kiválasztott elem a vektorba kerül, mielőtt kiválasztaná a következőt. A minta() függvényben definiált harmadik argumentum a „prob”, amely meghatározza a „my_data” vektor egyes elemeinek kijelölésének valószínűségét. Az első elem valószínűsége „0,5”. A fennmaradó négy vektorelem esetében a valószínűség „0,1”.

A következő kimenet a vártnak megfelelően a vektorok első elemének legnagyobb valószínűségével kerül leolvasásra:

6. példa: A Sample() függvény használata a Barplot megjelenítéséhez

Végül a minta() függvényt használjuk az R-beli barplot megszerkesztésére, hogy egy adott valószínűségi eloszlású kategorikus változó eloszlását vizualizáljuk.

minta adat = c ( 1 , 2 , 3 )

barplot ( asztal ( minta ( minta adat , méret = 500 , cserélje ki = IGAZ , prob = c ( .30 , .60 , .10 ) ) ) )

Itt, miután definiáltuk a „sample_data”-t egy egész érték vektorával, a minta() függvény telepítésével generáljuk a barplotot. Először a barplotot hívjuk meg, amely meghívja a table() függvényt, hogy létrehozza a kapott minta gyakorisági táblázatát. Ezután megadjuk a sample() függvényt a table() függvényen belül, ahol egy 1000 méretű véletlenszerű mintát veszünk egy 1-től 3-ig terjedő egész számokból álló vektorból. Ezután a „prob” argumentumot használjuk az egyes egész számok kiválasztásának valószínűségének meghatározására. .

Amint most láthatjuk, az oszlopdiagram a következő három oszloppal jelenik meg, minden egész számhoz egy, és az oszlopok magassága a mintában előforduló egész számra vonatkozik:

Következtetés

Különféle példákon láthattuk, hogyan működik a sample() függvény. A sample() függvény különböző argumentumokkal használatos, ahol a mintaadatokra van szükség, az összes többi argumentum pedig nem kötelező, és meghatározott esetekben hívható meg. A minta() függvény azonban hasznos a statisztikai elemzésben vagy nagy adatkészletekkel végzett munka során.