Pandas sorozat a CSV-re

Pandas Sorozat A Csv Re



A Pandas „Series.to_csv()” metódusa a megadott sorozatobjektumot vesszővel elválasztott értékek (csv) jelöléssel adja ki. Ez a függvény egyszerűen átveszi az értékeket egy sorozatból, és módosítja azok formátumát úgy, hogy vesszőt ad hozzá az index- és az oszlopértékek elválasztásához.

A függvény használatához a következő szintaxist kell használnunk:









Ez a cikk két különböző technikát kínál a módszer python programban való alkalmazásának megtanulásához.



1. példa: A Series.to_csv() módszer használata a DatetimeIndexet tartalmazó sorozatok vesszővel elválasztott értékekké alakításához

Egy sorozat CSV formátumra történő módosításához a „Series.to_csv()” függvényt használjuk. Ez az ábra egy sorozatot generál DatetimeIndex-szel, majd konvertálja azt vesszővel elválasztott értékek formátumba.





Ennek a metódusnak az üzembe helyezéséhez rendelkeznünk kell egy olyan eszközzel, amely támogatja a python programozást. A kódok összeállításához a „Spyder” eszközt választották. A szkript megírásához először elindítottuk a telepített eszközt a rendszerünkben. A python programnak szüksége van egy könyvtárra, hogy gyakorolhassa módszereit a kívánt eredmény eléréséhez. Az ide feltöltött könyvtár a „Pandák”. Ugyanebben a kódsorban ennek a könyvtárnak az álneve „pd”-ként van azonosítva. Tehát bárhol is van a programban, a „pandas” kifejezést kell írnunk egy függvény eléréséhez. Ehelyett azt írnánk, hogy „pd”.

A kóddal való kezdés első lépése egy Pandas sorozat létrehozása. A „pd”-t kell írnunk a pandák sorozatkészítési módszerének alkalmazásához. A „pd.Series()” függvény a megadott értékekkel sorozat létrehozására szolgál. Az általunk biztosított értékek a sorozathoz: „Isztambul”, „Izmir”, „Ankara”, „Ankara”, „Antalya”, „Konya” és „Bursa”. Ha nevet szeretne adni ennek az értéktömbnek, ezt a „name” paraméter használatával teheti meg. Itt ezt az értéktömböt „Cities”-nek neveztük el, mivel 6 város nevét tartalmazza. Ennek a sorozatnak a tárolásához létrejött egy „Törökország” sorozatobjektum.



A DatetimeIndex létrehozásához a „pd.date_range()” metódust hívtuk meg. A függvény zárójelei között 4 argumentumot adtunk meg, amelyek a következők: „start”, „freq”, „periods” és „tz”.

A „start” argumentum egy dátumot és időt vesz igénybe, hogy elkezdjen belőle dátumtartományt generálni. Itt a kezdő dátumot és időpontot „2022-03-02 02:30”-ban adtuk meg. A „freq” paraméter a gyakoriságot osztályozza a dátumtartományhoz. Tehát a „D” értékkel láttuk el. Most létrehoz egy dátumtartományt a napi gyakorisággal. A „period” argumentum értéke „6”, ami azt jelenti, hogy 6 napos dátumtartományt generál. Az utolsó paraméter a „tz”, amely a megadott terület időzónáját adja meg. Meghatároztuk az „Ázsia/Isztambul” időzónáját.

Ennek a dátumtartománynak a tárolásához létrehoztunk egy „Datetime” változót. A DatetimeIndex beállításához a „Series.index” tulajdonságot alkalmaztuk. A „Törökország” sorozat neve az „.index” tulajdonsággal együtt van ellátva, és hozzá van rendelve a „Datetime” változóban tárolt dátum-idő tartomány. Így az „index” tulajdonság átveszi a „Datetime” változó értékeit, és a „Törökország” sorozat indexlistájává teszi. Végül, a kimeneti sorozatok megtekintéséhez a „print()” metódust alkalmaztuk, és a „Törökország” sorozatot bemenetként adtuk át annak tartalmának megjelenítéséhez.

Csak megnyomtuk a „Fájl futtatása” opciót a szkript végrehajtásához. Következésképpen láthatunk egy sorozatot a DatetimeIndex-szel, amely „2022-03-02 02:30:00+03:00” kezdetű és „2022-03-07 02:30:00+03:00”-ra végződik, létrehozva egy időszakot. 6 napból. A sorozat alatt a „Freq :D”, a „Cities” tömblista neve és a dtype „object” is szerepel.

Most megtanuljuk konvertálni ezt a sorozatot, amelyet a fenti pillanatképen láttunk, CSV formátumba. A sorozatok vesszővel elválasztott értékekre való módosításához a pandas modul által biztosított módszerünk a „Series.to_csv()”. Ez a módszer a megadott sorozat értékeit veszi fel, és vesszőt ad az oszlop értékei közé.

A „Series.to_csv()” függvény meghívásra kerül. A konvertálni kívánt sorozat nevét a metódussal „Turkey.to_csv()”-ként említjük. A vesszővel elválasztott értékek megőrzése érdekében létrehoztunk egy „Comma_Separated” változót, majd ennek tartalmát a „print()” függvény meghívásával a kimeneti ablakba helyeztük.

Íme a sorozatunk csv formátumban. A pillanatképen láthatjuk, hogy az index és a sorozatértékek vesszővel lettek elválasztva.

2. példa: A Series.to_csv() módszer használata a NaN-értékeket tartalmazó sorozatok vesszővel elválasztott értékekké alakításához

A „Series.to_csv()” metódus gyakorlásának második módja az, hogy ezt a módszert alkalmazzuk néhány null bejegyzést tartalmazó sorozat CSV formátumba konvertálására.

Kezdetben importáltuk a szükséges csomagokat. A „pd” a pandák álneve, az „np” pedig a numpy álneve. A numpy eszközkészlet azért van itt betöltve, mert néhány null bejegyzést fogunk bevinni a sorozatunkba az „np.NaN” használatával, miközben a pandas „pd.Series()” metódussal hozzuk létre.

A „pd.Series()” függvény meghívásra kerül a következő értékekkel rendelkező pandasorozat felépítéséhez: „Nile”, „Amazon”, np.NaN, „Ganges”, „Mississippi”, „np.NaN”, „Yangtze”, „Duna”, „Mekong”, „np.NaN” és „Volga”. Összesen 21 érték van meghatározva a sorozathoz, amelyek közül 3 bejegyzés „np.NaN” értékkel rendelkezik, ami azt jelenti, hogy 3 érték hiányzik a sorozatból. A „name” tulajdonság ennek az értéktömbnek a nevét adja meg, amelyet „Titles”-ként adtunk meg. Az „index” tulajdonság a felhasználó által meghatározott indexlista beállítására szolgál az alapértelmezett lista helyett.

Itt szeretnénk egy indexlistát a következő értékekkel: „10”, „11”, „12”, „13”, „14”, „16”, „17”, „18”, „19”, „20”, és 21”. Most sorozatunkban az indexlista „0” helyett „10”-től kezdődik. Most tárolja ezt a sorozatot, hogy később felhasználhassuk a programban. Inicializáltunk egy „Rivers” sorozatobjektumot, és kiosztjuk neki a „pd.Series()” metódus meghívásával létrehozott kimeneti sorozatot. A sorozat megtekinthető, ha a python „print()” funkciójával megjelenítjük.

A terminálon megjelenített kimenet egy sorozatot nyomtatott, amelynek indexlistája 10-től kezdődik és 21-nél végződik, ami azt jelenti, hogy a sorozat 21 értékkel rendelkezik.

A sorozatot a „Series.to_csv()” metódussal CSV formátummá alakítjuk.

Meghívtuk a „Series.to_csv()” metódust a „Törökország” sorozatunkkal. Ezért ez a módszer átveszi a „Törökország” sorozat értékeit, és vesszővel elválasztott értékek formátumba konvertálja azokat. Az eredmény a „Converted_csv” változóba kerül mentésre. És végül a konvertált sorozat a „print()” függvény segítségével kerül kinyomtatásra.

Az eredmény alábbi pillanatképen látható, hogy a sorozatok értékei mostanra módosultak, és vesszővel választják el őket az indexlistától. Sőt, ahol az értékek hiányoznak, ott csak az indexszám kerül kinyomtatásra vesszővel.

Következtetés

Egy panda sorozat módosítása CSV formátumra praktikus megközelítés. Ezt a pandas „Series.to_csv()” függvény használatával érhetjük el. Ez az útmutató két technikát hozott a gyakorlatba ennek a módszernek az alkalmazására. Az első ábrán ezt a módszert hívtuk meg a DatetimeIndex-szel rendelkező sorozatok vesszővel elválasztott értékek formátummá alakításához. A 2. példány a „Series.to_csv()”  függvényt használta a néhány hiányzó bejegyzést tartalmazó sorozat CSV formátumba történő módosítására. Mindkét technikát gyakorlatilag a „Spyder” eszközzel valósították meg Windows operációs rendszeren.