Tartalomjegyzék:
Meghatározás - Mit jelent az Apache Kudu?
Az Apache Kudu a nyílt forráskódú Apache Hadoop ökoszisztéma tagja. Ez egy strukturált adatokra szánt nyílt forrású tárolómotor, amely támogatja az alacsony késleltetésű véletlenszerű hozzáférést és a hatékony analitikus hozzáférési mintákat. Úgy tervezték és hajtották végre, hogy áthidalják a rést a széles körben használt Hadoop elosztott fájlrendszer (HDFS) és a HBase NoSQL Database között. Noha ezek a rendszerek még mindig előnyösnek bizonyulhatnak, az Apache Kudu számos általános munkaterhelést képes kiszolgálni, mivel ez drasztikusan egyszerűsíti azok architektúráját.
A Techopedia magyarázza az Apache Kudu-t
Az Apache Kudu elsősorban a Cloudera projektjeként került kifejlesztésre. Az eddigi hozzájárulások nagy részét a Cloudera által alkalmazott fejlesztők adták. A kiadás során csak a kényelmi bináris fájlokat vették fel a Cloudera adattáraiban, azonban az inkubátorhoz való csatlakozáskor elfogadta az Apache Software Foundation (ASF) forráskiadási folyamatát. Kifejezetten olyan esetekre tervezték, amelyek gyors elemzést igényelnek a gyors adatokkal kapcsolatban. Úgy tervezték, hogy kihasználják a következő generációs hardver és a memóriában történő feldolgozás előnyeit. Jelentősen csökkenti a lekérdezés késleltetését az Apache Impala és az Apache Spark esetében. Az adatokat oszloposzlop-tároló motoron vagy vízszintes partíción keresztül terjeszti, majd minden partíciót replikálja Raft-konszenzussal, így alacsony középidőt jelent a helyreállításig és alacsony farok késleltetést eredményez.
Bár a Kudu az Apache Hadoop ökoszisztéma összefüggésében tervezett termék, támogatja az integrációt más adatanalitikai projektekkel az ASF-en belül és kívül.
Az Apache Kudu hatékonyságának bizonyul, mivel valós idejű elemző munkaterheléseket képes feldolgozni egyetlen tároló rétegen keresztül, így rugalmasságot adva az építészeknek az egzotikus megoldások nélküli, széleskörű felhasználási esetek kezelésére.