Egyedi Pandas Dataframe

Egyedi Pandas Dataframe



Az adattudományban használt legnépszerűbb Python-könyvtár a Pandas. A Python programozóknak nagy teljesítményű, felhasználóbarát és adatelemző eszközöket kínál. Miután megértette az alapvető funkciókat és azok felhasználását, a Pandas hatékony eszköz az adatok megváltoztatására. A „pandákban” az adatok táblázatos formában történő tárolásának szabványos módszerei a DataFrame-ek. Használhatunk néhány „pandas” módszert a „pandas” DataFrame oszlopban található egyedi értékek lekérésére. Ha egyedi értékeket kell beszereznünk a DataFrame oszlopaiban, és nem akarjuk, hogy a „pandas” DataFrame oszlopában az értékek duplikálódjanak, használhatjuk a „pandas” által biztosított módszereket erre. Nézzük meg az ilyen módszereket ebben az útmutatóban, néhány példával és kimenettel együtt, hogy egyedi értékeket kapjunk a DataFrame „pandák” oszlopában.

Módszerek egyedi értékek lekérésére a „pandák” DataFrame oszlopaiban

Két módszert használhatunk a „pandas” DataFrame oszlopaiban található egyedi értékek beszerzésére. Eldobjuk az ismétlődő értékeket, és csak az egyedi értékeket kapjuk meg a DataFrames oszlopaiban. A „pandák” által biztosított módszerek ennek a feladatnak a végrehajtására a következők:







  • Az egyedi() metódus használatával.
  • A drop_dupliactes() metódus használatával.

Most mindkét módszert használjuk a „pandas” kódokban, hogy megkapjuk az egyedi értékeket a „pandas” DataFrame oszlopaiban.



Példa # 01

A „Spyder” alkalmazást itt használjuk a „panda” kódok generálására, hogy felhasználjuk azokat a módszereket, amelyek segítenek a „pandas” DataFrame oszlopaiban található egyedi értékek beszerzésében. A DataFrame létrehozása előtt importálnunk kell a „pandas” kódhoz szükséges „pandas” modulokat. Az „import” kifejezés használatával és a „pandák pd-ként” elhelyezésével ezeket a modulokat importáljuk.



Most a „pd” segítségével gyorsan megszerezhetjük a „panda” függvényeket vagy metódusokat. Ezután hozzáadjuk a „Subject_data”-t, amelyben hozzáadjuk a „Name”-t, a „Név”-be pedig hozzáadjuk a név adatait, amelyek a következők: „Roman, William, Peter, Smith, John, Milli, Thomas és James”. Ezután hozzáadjuk a tárgyadatokat a „Subj”-ban, amelyek a következők: „Matek, közgazdaságtan, természettudományok, matematika, statisztika, statisztika, statisztika és számítógép”. Ezután ezt a „Subject_data”-t a „pd.DataFrame()” metódussal „Subject_df” DataFrame-be konvertáljuk. A „Subject_df”-et a „print()” metódusba helyezzük, így az megjelenik a terminálon.





Most szeretnénk megkapni az egyedi értékeket a „pandas” DataFrame „Subj” oszlopában. Erre a célra itt az „unique()” metódust használjuk, és hozzáadjuk az oszlop nevét, valamint a DataFrame nevét, ahogy az alább látható. Ezt a metódust hozzáadjuk a „print()”-hez, így az eredmény a terminálon is megjelenik.



Most megnyomjuk a „Shift+Enter” billentyűket, hogy megkapjuk ennek a kódnak az eredményét, és ez megjelenik a terminálon, és itt is megjelenik, amely tartalmazza a DataFrame-et minden értékkel együtt. Ez az eredeti DataFrame, amelyet hozzáadtunk a kódhoz, és alatta jelennek meg a „Subj” oszlop egyedi értékei. Eldobja az ismétlődő értékeket, és megjeleníti a DataFrame „Subj” oszlopának egyedi értékeit.

02. példa

Létrehozzuk a „Sample_list”-t, amely bizonyos információkat tartalmaz. Beszúrjuk a „Layla, 21, 28, 31, 14 és 39” szöveget, amely az első oszlopként jelenik meg, amikor ezt a listát DataFrame-be konvertáljuk. Ezután hozzáadjuk a „Lusy, 31, 25, 34, 26 és 21” karakterláncot a DataFrame második soraként. Ezt követően a „Peter, 38, 20, 20, 35 és 24” és a „Layla 38, 23, 39 24, 23” lesz a DataFrame harmadik és negyedik sora. Három további adatot is beszúrunk, amelyek a következők: „Stella, 21, 24, 24, 28, 31”, „Layla, 33, 32, 26, 30, 25” és „Péter, 21, 21, 31, 21, 29” .

Most a „pd.DataFrame()” függvény segítségével a „Sample_list”-et „DF_Sample”-vé alakítjuk, ami a DataFrame neve. Ezenkívül beállítjuk a DataFrame oszlopainak nevét, és ezek a nevek: „Név, Segéd_1, Segéd_2, Segéd_3, Segéd_4 és Ass_5”. Ezután a „print()”-et használjuk, amely segít a DataFrame „DF_Sample” megjelenítésében. Ebben a példában egy másik módszert használunk a DataFrame oszlopban található egyedi értékek lekérésére. Ez a metódus a „pandas” „drop_duplicates()” metódusa.

A „drop_duplicates()” metódusban beállítjuk annak az oszlopnak a nevét, ahonnan a DataFrame oszlopában az egyedi értékeket szeretnénk megkapni. A „Név” oszlop egyedi értékeit úgy kapjuk meg, hogy a „drop_duplicates()” metódus segítségével eldobjuk a duplikált értékeket ebben az oszlopban, és itt a „print()” függvény segítségével jelenítjük meg ezeket az egyedi értékeket.

A duplikált neveket a rendszer eldobja, és egyedi értékeket jelenít meg a „drop_duplicates()” metódus alkalmazása után. Megjegyzendő, hogy a „Layla” név a „Név” oszlop három cellájában jelenik meg. De amikor a „drop_duplicates()” metódust alkalmazzuk erre az oszlopra, az összes ismétlődő érték kimarad, és egy „Layla” név jelenik meg a képernyőn. Az ismétlődő értékek eldobása után megjelent az új DataFrame, amely ebben a „Név” oszlopban tartalmazza az egyedi értékeket. Így a „drop_duplicates()” metódus segítségével eldobhatjuk a duplikált értékeket, és megkaphatjuk az egyedi értéket a DataFrame oszlopában.

03. példa

Újra ugyanazt a DataFrame-et használjuk, és most itt az „unique()” metódust alkalmazzuk. Az „unique()” metódussal elhelyezzük annak az oszlopnak a nevét, valamint annak a DataFrame-nek a nevét, amelyre ezt az „unique()” metódust alkalmazni szeretnénk az egyedi értékek lekéréséhez. Ez csak az adott oszlop egyedi értékeit jeleníti meg, és nem jeleníti meg ezeket az értékeket DataFrame formájában.

Itt a DataFrame hét értéket tartalmaz a „Név” oszlopban, de amikor az „unique()” metódust alkalmazzuk erre az oszlopra, csak négy érték jelenik meg, és ezek az oszlop egyedi értékei. Nem jelenít meg ismétlődő értékeket.

04. példa

Az ebben a példában létrehozott DataFrame az „F_G_df”. A „My_fruits” és „my_Vegs” kifejezéseket beillesztjük ebbe a DataFrame-be. A „My_fruits” oszlop az „alma, narancs, alma, körte, licsi, alma, alma, körte és alma” elemet tartalmazza. Következő következik a „My_Vegs”, amely a zöldségek neveit tartalmazza: „Chilli, Bringle, sárgarépa, burgonya, burgonya, sárgarépa, hagyma, fokhagyma és gyömbér”. Ez a DataFrame csak két oszlopot tartalmaz.

Most mindkét oszlopban megkapjuk az egyedi értékeket az „unique()” metódus segítségével. Megemlítjük a DataFrame nevét. Ezután írja be az oszlop első oszlopának nevét. Ezt követően az append() metódust használjuk. Ebben a függelékben ismét elhelyezzük a DataFrame nevét és a második oszlop nevét, és elhelyezzük az „unique()” metódust. Ezzel megkapja mindkét oszlop egyedi értékét, majd hozzáfűzi mindkét oszlop egyedi értékét, és megjelenik a képernyőn.

A DataFrame először az összes értéket tartalmazza. Ezt követően az „unique()” metódus kerül alkalmazásra, és mindkét oszlop egyedi értékei az alábbiakban jelennek meg. Ebben a kódban a DataFrame több oszlopában lévő egyedi értékeket kapjuk meg az „unique()” metódussal.

Következtetés

A DataFrame oszlopban található egyedi értékek lekérésének teljes magyarázata ebben az útmutatóban található. Megbeszéltük az „unique()” és a „drop_duplicates()” metódusokat, amelyek segítenek a DataFrame oszlopának egyedi értékeinek beszerzésében. Megvizsgáltuk, hogyan használhatjuk ezeket a metódusokat a „panda” kódban azáltal, hogy ezeket a módszereket használjuk a kódjainkban. Ebben az útmutatóban különböző példákat mutattunk be, és megmutattuk, hogyan kaphatja meg egy oszlop egyedi értékeit az „unique()” és a „drop_duplicates()” metódussal. Azt is megvizsgáltuk, hogyan lehet több oszlopban egyedi értékeket kapni az „unique()” metódus használatával ebben az útmutatóban.