Mik az Amazon Redshift adattípusai?

Mik Az Amazon Redshift Adattipusai



Az Amazon Redshift az AWS által kínált felhőalapú megoldás, amely teljesíti az adattárház célját. Az adattárház egy nagy hely a felhőben, amely hatalmas mennyiségű adatot tárol. Az adattárház és az adatbázis közötti különbség az, hogy az előbbi nem csak az aktuális adatokat tárolja, hanem az adatok teljes történetét is.

Ebből a cikkből megismerheti az AWS Amazon Redshiftjét és a szolgáltatás által támogatott adattípusokat.







Mi az Amazon RedShift?

Ez egy felhőalapú megoldás az adattárházhoz, amelyen alapul 'PostgreSQL' . Az úgynevezett technológiát használja „Masszívan párhuzamos feldolgozás (MPP)” petabájtnyi adatot villámgyorsan feldolgozni. Ez egyszerű megoldást kínál a valós idejű előrejelzéshez a korábbi adatokon és a streaming megoldásokon.



Az alábbi ábra az Amazon Redshift működési mechanizmusát mutatja be:







Az Amazon Redshift működésének ez a grafikus magyarázata nagyon egyszerű és világos. Információkat ad nekünk arról, hogyan lehet az adatokat lekérni és feldolgozni kimenetek generálásához és adatvezérelt alkalmazások létrehozásához.

Az Amazon Redshift adattárház architektúrája az alábbi ábrán is látható:



Most áttérünk a szolgáltatás használatára és funkcióira.

Jellemzők

Mint már említettük, az Amazon Redshift a PostgreSQL-en alapul, és a Massively Parallel Processing nevű technológiát használja, amely lehetővé teszi, hogy pillanatok alatt feldolgozzon petabájtnyi adatot. Ezért a Redshift számos funkciót és felhasználási lehetőséget kínál. Ezek közül néhány az alábbiakban található:

  • Adatbiztonság és titkosítás.
  • Üzleti elemzés.
  • Adatvezérelt alkalmazások támogatása.
  • Prediktív elemzés.
  • Automatizált feladatismétlés.
  • Párhuzamos adatskálázás.
  • Adattárház.

A szolgáltatás néhány extra funkciója az alábbi ábrán látható:

Ez volt a Redshift által kínált legtöbb szolgáltatás, és most áttérünk a szolgáltatás által támogatott adattípusokra.

Adattípusok

Az Amazon Redshift egy adattárolási megoldás számos funkcióval. Strukturált és strukturálatlan adattípusokat egyaránt támogat. Mivel a PostgreSQL-en alapul, az adatok egyszerű SQL lekérdezésekkel kezelhetők.

Felmerül egy másik kérdés, vagyis miben különböznek ezek az adatformátumok egymástól? Beszéljük meg ezt a két adatformátumot.

Strukturált adatok

A gépi tanulási algoritmusokkal könnyen lefordítható, erősen formázott adattípust strukturált adatoknak nevezzük. Az SQL adatbázis strukturált adatokkal működik. A strukturált adatok táblázatos formában vannak, például a relációs adatbázisok által használt adatok

Az egyik széles körben használt SQL adatbázis-kezelő rendszer a MYSQL. Felépítése az alábbi ábrán látható:

Strukturálatlan adatok

A strukturálatlan adatok mintázatosabbak és kevesebb adatformátumúak, mint például a nem relációs adatbázisokban használt adatok. A MongoDB egy híres nem relációs adatbázis. Az SQL lekérdezések nem működnek nem relációs adatbázisokon, ezért ezeket az adatbázisokat NoSQL adatbázisoknak is nevezik.

Mint már említettük, a MongoDB egy nem strukturált adatbázis-kezelő rendszer, melynek architektúrája az alábbi ábrán látható:

Végigmentünk az adatbázisokban használt két alapvető adattípuson, és most áttérünk az Amazon Redshift által támogatott tényleges adattípusokra. Ezek az adattípusok a következők:

  • Numerikus adatok
  • Karakter adatok
  • Dátum és idő adatok
  • Logikai adatok
  • HLLSKETCH adatok
  • SZUPER adatok
  • CSERE Adatok

Beszéljük meg ezeket az adattípusokat:

Numerikus adatok

Ez az adattípus magától értetődő. Támogatja az egész számok, tizedesjegyek, lebegőpontos és más numerikus adattípusok formájú adatokat.

Az egész adattípus jellemzői az alábbi ábrán láthatók:

A decimális adattípus a felhasználó pontossága alapján tárolja az adatokat. Jellemzői a következők:

Karakter adatok

A CHAR és a VARCHAR adattípusok a karakter alapú adattípusok kategóriájába tartoznak. Az NCHAR és a NVARCHAR szintén karakter típusú adattípusok. A CHAR-tól és a VARCHAR-tól eltérően ez a két adattípus rögzített hosszúságú, Unicode karaktereket tárol. Nézzük meg ezeknek az adattípusoknak a tulajdonságait, például:

  • A CHAR, CHARACTER, NCHAR tartománya 4 KB.
  • A VARCHAR, az NVARCHAR hatótávolsága 64 KB.
  • A BPCHAR tartománya 256 bájt.
  • A TEXT tartománya 260 bájt.

Dátum és idő adatok

A dátum és idő adattípusai: DATE, TIME, TIMETZ, TIMETZ, TIMESTAMPTZ. Ezen adattípusok funkcionális képességei a következők:

  • A DATE egyszerűen a naptári dátumokat tárolja.
  • Az IDŐ az időt időzónára való hivatkozás nélkül tárolja. Ez alapértelmezés szerint UTC.
  • A TIMETZ az időt az időzónához viszonyítva tárolja. Alapértelmezés szerint a felhasználói táblákban és a rendszertáblázatokban is UTC.
  • A TIMESTAMP nemcsak az időt, hanem a dátumokat is tartalmazza. A felhasználói táblákban és a rendszertáblázatokban is alapértelmezés szerint UTC.
  • A TIMESTAMPTZ nem csak az időt, hanem a dátumokat is tartalmazza. Alapértelmezés szerint csak felhasználói táblákban UTC.

Logikai adatok

A logikai adattípus egy bináris adattípus, ami azt jelenti, hogy csak két érték van. A Boole-féle adattípus jellemzői táblázata az alábbi ábrán látható:

HLLSKETCH adatok

Ez az adattípus vázlatok tárolására szolgál. A vöröseltolódás a vázlatokat ritka vagy sűrű formában is ábrázolhatja. A vázlatok ritkásan kezdődnek, és fokozatosan sűrűsödnek, amikor a sűrű formátum nagyobb hatékonyságot biztosít a hivatkozás követésével.

SZUPER adatok

Ez az adattípus strukturálatlan adatokkal foglalkozik, amelyek lehetnek tömbök, beágyazott struktúrák vagy JSON formájában. Az adatoknak nincs modellje vagy formátuma. A felhasználók a linkre navigálva további információkat fedezhetnek fel.

CSERE Adatok

Ez az adattípus karaktereket is tárol. A hossza azonban korlátozott. Az Amazon Redshift lehetővé teszi a VARBYTE adatok bármilyen egész vagy karakter típusú adatba öntését. Ha többet szeretne megtudni erről az adattípusról, kövesse az alábbi linket.

Az Amazon Redshift és az általa támogatott adattípusok csak ennyit tartalmaznak.

Következtetés

Az Amazon Redshift egy AWS szolgáltatás, amely alapvető formájában adattárház célját szolgálja, de egy nagyon hatékony és jellemző megoldás az elemzéshez és előrejelzéshez. Ez a cikk a Redshifttel és az általa támogatott adattípusokkal foglalkozik. Ezeket az adattípusokat röviden ismertettük jellemzőikkel együtt.