1. példa: A Sample() függvény használata az adatargumentummal
Az R minta() függvényét a mintaadatokkal együtt kell ellátni egy szám véletlenszerű generálásához. A mintaadat a sample() függvény szükséges argumentuma, amelynek kódja a következő:
adatokX < - c ( 10 , húsz , 30 , 40 , ötven , 60 , 70 , 80 , 90 , 100 )minta ( adatokX , 3 )
minta ( adatokX , 3 )
Itt először generáljuk a „dataX” változón belüli egész elemek vektorait. Ezután kétszer meghívjuk a minta() függvényt a kódban, és átadjuk neki a korábban generált „dataX” vektort argumentumként. A minta (dataX, 3) első használata három elemből álló véletlenszerű mintát vesz a „dataX” vektorból. Az eredmény a „dataX” három elemének véletlenszerű permutációja. Ezután ismét az (a, 5) mintát használjuk, amely egy másik független véletlenszerű mintát vesz három elemből a „dataX” vektorból. Ezúttal az eredmény teljesen eltér az előzőtől.
A kimenet a sample() függvény kétszeri meghívásakor mutatja meg a különböző elemeket. Vegye figyelembe, hogy minden alkalommal, amikor véletlenszerűen hozzuk létre a mintát, a vektorokból különböző elemeket kapunk:
2. példa: A Sample() függvény használata a Csere argumentummal
Továbbá megvan a minta() függvény „csere” argumentuma, amely a logikai értékeket veszi fel. Egy hasonló elem többször is kiválasztható, ha az elem mintavételezése a helyettesítési opcióval, TRUE. Ha azonban az érték FALSE-ra van állítva, akkor minden elemből csak egy választható lehet, ami az elemek mintavételezését eredményezi csere nélkül.
véletlen_számok = c ( tizenegy , 25 , 12 , 89 , Négy öt , 16 , 67 , 38 , 96 , 55 , 73 )
minta ( véletlen_számok , 4 , cserélje ki = IGAZ )
minta ( véletlen_számok , 5 , cserélje ki = IGAZ )
Itt először definiáljuk a vektort néhány numerikus értékkel a „random_numbers” változóban. Ezt követően meghívjuk a sample() függvényt, ahol a „random_numbers” argumentumként kerül átadásra. A „4” érték a sample() függvényben van megadva, ami azt jelzi, hogy csak négy véletlenszerű értéket választ ki a „random_numbers” vektorokból.
Ezután a sample() függvényben a change=TRUE azt határozza meg, hogy minden érték többször is kiválasztható. Ezután ismét üzembe helyezzük a sample() függvényt, amely ezúttal „5” véletlenszerű értéket választ ki a vektorokból. Hasonlóképpen a helyettesítő argumentumot „TRUE”-re állítjuk be, mint korábban az egyes értékek többszörös kiválasztási opcióinál.
Amint látjuk, az első kimenet 4 véletlenszerűen kiválasztott elem vektorát jeleníti meg a „random_numbers” vektorból. A következő kimenet azonban egy „5” véletlenszerűen kiválasztott elemből álló vektort jelenít meg:
3. példa: A Sample() függvény használata a méret argumentummal
A következő argumentum, amelyet a sample() függvény átenged, a „size”. A „size” egy opcionális paraméter, amely a minták értékét jelzi. A minta() függvény kódja a „size” paraméterrel az alábbiakban található:
vektorok < - 1 : 10minta ( vektorok , méret = 5 )
Itt a numerikus vektort a „vectors” változóban 1 és 10 közötti egész számok sorozataként határozzuk meg. A minta() függvényt ezután a vektorból véletlenszerű elemek kiválasztására használják. Amint látjuk, a sample() függvénynek két argumentuma van. Az első argumentum a vektorok, amelyekből a mintát kapjuk. A következő argumentum az „5” értékkel megadott méret, ami azt jelzi, hogy csak öt elemet kell kiválasztani a vektorból.
Ezért a kiválasztott elemek véletlen sorrendben, új vektorként jelennek meg a következő kimenetben:
4. példa: A Sample() függvény használata az R listához
Ezenkívül a sample() függvény használható az R-beli listához. A példa ezen része véletlenszerű értékeket kap a listából.
R_list < - lista ( 1 : 4 ,913 ,
c ( 'X' , 'ÉÉÉ' , 'JÓ' ) ,
'ZZZ' ,
5 )
eredmény < - R_list [ minta ( 1 :hossz ( R_list ) , méret = 4 ) ]
eredmény
Itt az „R_list” listája különböző típusú elemekkel van definiálva, beleértve egy numerikus vektort, egy számot, egy karaktervektort, egy karakterláncot és egy másik számot. Ezt követően létrehozunk egy „eredmény” változót, ahol a sample() függvény meghívásra kerül.
A sample() függvényen belül beállítjuk az „1:length(R_list)” kifejezést, amely jelzi az indexek vektorait, amelyeken keresztül mintát kell venni. Ezután van egy „size” argumentum a mintavételezendő elemek számának megadására, amely „4”. Ezért az „R_list” három véletlenszerűen kiválasztott elemet generál az „R_list” listából. Mivel az „R_list” listában szereplő elemek különböző típusúak, az „eredmény”-ben kapott elemek is különböző típusúak lehetnek.
A kimenet az új listát jelenti, amely az eredeti lista véletlenszerű részhalmazát tartalmazza:
5. példa: A Sample() függvény használata a Prob argumentummal
Ezenkívül a minta() függvény „prob” paraméterével rendelkezünk. A „prob” argumentum a kiválasztott elem valószínűségét adja meg a vektorban. Ne feledje, hogy minden elem azonos valószínűségűnek tekinthető, ha a „prob” argumentumot nem használja.
adataim = c ( 31 , 99 , 5 , 24 , 72 )minta ( adataim , méret = 10 , cserélje ki = IGAZ ,
prob = c ( 0.5 , ismétlés ( 0.1 , 4 ) ) )
Itt a numerikus vektorok elemeit a „saját_adat”-nak nevezzük. A következő lépésben meghívjuk a minta() függvényt, ahol a „my_data” átadásra kerül belőle véletlenszerűen kiválasztott 10 elemnek. Ezután meghatározásra kerül a „size” argumentum, amely meghatározza, hogy a véletlenszerűen kiválasztandó érték „10” méretű legyen. Ezt követően a „replace” argumentumhoz „TRUE”-t rendelünk, ami azt jelenti, hogy minden kiválasztott elem a vektorba kerül, mielőtt kiválasztaná a következőt. A minta() függvényben definiált harmadik argumentum a „prob”, amely meghatározza a „my_data” vektor egyes elemeinek kijelölésének valószínűségét. Az első elem valószínűsége „0,5”. A fennmaradó négy vektorelem esetében a valószínűség „0,1”.
A következő kimenet a vártnak megfelelően a vektorok első elemének legnagyobb valószínűségével kerül leolvasásra:
6. példa: A Sample() függvény használata a Barplot megjelenítéséhez
Végül a minta() függvényt használjuk az R-beli barplot megszerkesztésére, hogy egy adott valószínűségi eloszlású kategorikus változó eloszlását vizualizáljuk.
minta adat = c ( 1 , 2 , 3 )barplot ( asztal ( minta ( minta adat , méret = 500 , cserélje ki = IGAZ , prob = c ( .30 , .60 , .10 ) ) ) )
Itt, miután definiáltuk a „sample_data”-t egy egész érték vektorával, a minta() függvény telepítésével generáljuk a barplotot. Először a barplotot hívjuk meg, amely meghívja a table() függvényt, hogy létrehozza a kapott minta gyakorisági táblázatát. Ezután megadjuk a sample() függvényt a table() függvényen belül, ahol egy 1000 méretű véletlenszerű mintát veszünk egy 1-től 3-ig terjedő egész számokból álló vektorból. Ezután a „prob” argumentumot használjuk az egyes egész számok kiválasztásának valószínűségének meghatározására. .
Amint most láthatjuk, az oszlopdiagram a következő három oszloppal jelenik meg, minden egész számhoz egy, és az oszlopok magassága a mintában előforduló egész számra vonatkozik:
Következtetés
Különféle példákon láthattuk, hogyan működik a sample() függvény. A sample() függvény különböző argumentumokkal használatos, ahol a mintaadatokra van szükség, az összes többi argumentum pedig nem kötelező, és meghatározott esetekben hívható meg. A minta() függvény azonban hasznos a statisztikai elemzésben vagy nagy adatkészletekkel végzett munka során.