Előre lendület: a tradicionálison túlmutató reláció mozgatása

2026

A Techopedia munkatársai, 2016. június 8

Elvihető: Eric Kavanaugh, a házigazda az adatbázis-technológiai újításokat tárgyalja Dez Blanchfield, Robin Bloor és Bert Scalzo szakértőkkel.

Jelenleg nincs bejelentkezve. Kérjük, jelentkezzen be vagy jelentkezzen be a videó megtekintéséhez.

Eric Kavanagh: Hölgyeim és uraim, szerdán van, négy keleti idő szerint. New Orleans-ban vagyok, a nyár közeledik, ez azt jelenti, hogy forró! Itt az ideje a Hot Technologies-nek, igen, igen, valóban. A nevem Eric Kavanagh, én leszek a házigazda. Vissza fogom rúgni a labdát a Hot Technologies számára. A mai téma a „Lépés előre: A kapcsolatok átlépése a hagyományoson túl”. Az emberek ma három telefon-szakértővel rendelkeznek a telefonon, tehát bármilyen kérdése van, küldje el nekik a kemény kérdéseit, ne légy félénk. Ma van egy csomó jó tartalom, amelyet ma felsorolunk. Van valódi helyed a tiéddel, elég rólam. Természetesen ez az év forró. A forró technológiákról beszélünk ebben a műsorban, amely partnerség a Techopedia barátaival. És egészen a mai információmenedzsment alapjáig megyünk, amely természetesen az adatbázis. Arról fogunk beszélni, hogy hogyan jutottunk ide, mi történik ma, és mi folyik tovább. Rengeteg nagyon érdekes dolog folyik itt.

Nyilvánvaló, hogy van néhány komoly újítás az adatbázis területén. Egy darabig csendes volt; Ha beszélünk néhány elemzővel az üzleti életben, akkor azt mondanám, hogy valószínűleg a 2005-től a 2009-ig vagy a '10-ig tartó évtől kezdve nem tűnt úgy, hogy túl sok lenne az innováció terén. És hirtelen éppen úgy tört ki, mint egy jailbreak vagy valami, és most mindenféle érdekes dolog történik. Ennek nagy része az internetes méret és az összes hűvös webtulajdonság miatt van, amelyek különféle érdekes dolgokat csinálnak. Innen jött a NoSQL koncepció. És ez két különféle dolgot jelent: ez azt jelenti, hogy nincs SQL, mivel az nem támogatja az SQL-t, nem csak az SQL-t is jelenti. Van egy „NewSQL” kifejezés, amelyet néhány ember használ. De nyilvánvalóan az SQL - a Strukturált lekérdezési nyelv - valóban az alap, a lekérdezés alapja.

És érdekes, hogy ezek a NoSQL motorok, mi történt? Nos, kijöttek, sok izgalom volt róla, majd néhány évvel később, mit kezdtünk hallani? Ó, SQL a Hadoop-on. Nos, ezek a vállalatok elkezdték az SQL interfészek levágását a NoSQL eszközeikre, és bárki, aki a programozási világban van, tudja, hogy ez bizonyos kihívásokhoz és nehézségekhez vezet, és egyesekhez vezetékes vezetékekhez és így tovább. Tehát ma sok mindent megtudunk.

Három előadónk van: felhívjuk Dez Blanchfield-t Sydney-ből, a saját Robin Bloor-t, aki Texasban van, és Bert Scalzo, Texasban is. Tehát először Dez Blanchfieldtől fogunk hallani. Emberek, csippelünk a #HotTech hashtagján, ezért nyugodtan küldje el észrevételeit, vagy küldje el kérdéseit a webcast-konzol Q & A komponensén keresztül, vagy akár a csevegőablakon keresztül. És ezzel, Dez Blanchfield, vegye el.

Dez Blanchfield: Köszönöm, Eric. Sziasztok. Tehát megpróbálom beállítani a helyszínt egy 30 000 lábnyira nézve, hogy mi történik az elmúlt évtizedben, és a jelentős változások, amelyeket már látunk - vagy legalábbis másfél évtizeddel - adatbáziskezelő rendszerek, valamint néhány kereskedelmi vagy műszaki szempontból befolyásoló hatás, valamint néhány olyan trend, amelyet későn elvisztünk, és vezet bennünket a beszélgetésbe, amelyet ma a témában folytatunk.

Borítóképem itt egy homokdűnék, és a tetején szél fúj apró apró homokdarabot. És ennek eredményeként történik az, hogy a homokdűne lassan sétál az egyik helyről a másikra. És ez egy csodálatos jelenség, ahol ezek a hatalmas 40 és 50 láb magas homokhegyen valójában valóban mozognak. És nagyon lassan mozognak, de biztosan mozognak, és ahogy mozognak, megváltoztatják a tájat. És nagyon érdemes megnézni, ha egyáltalán időt tölt egy olyan helyen, ahol a homokdűnék természetes dolog. Mivel egy nap kinézhet az ablakon, és rájön, hogy ez a hatalmas homok hegy, apró apró szemcsék valójában önmagukban mozogtak, és hogy a szél lassan elmozdítja egyik helyről a másikra.

És azt hiszem, hogy sok szempontból ez az adatbázis-rendszerek világa már jó ideje. Egészen egészen a közelmúltig ez a nagyon kicsi eltolódás homok szemcsék formájában, egy óriási homok hegyet mozgatva homokdűne formájában. Az évek során kevés váltás történt az adatbázis-platformokon, és ez egy meglehetősen stabil és szilárd környezet volt az adatbázis-rendszerek és platformok körül, a középkategória nagyszámú rendszerén keresztül. De későn néhány meglehetősen jelentős dolog történt a kereskedelmi igényekkel és a műszaki vezetőinkkel. Átmegyek minket azokon.

Véleményem szerint az adatbázis alapfogalma, ahogyan azt sok-sok éven át ismertük, és amint azt a show-előtti eseményekről is hallhatta, két szakértőnk, akik ma velem hívnak, egy életen át ezt a teret, és nekik teljesen igaza van, ha megosztják a létező bizalmas jogokat, amikor az egész a 80-as évek elején kezdődött. De láttunk egy kicsit az elmúlt évtizedben ezt a hatalmas változást, és gyorsan átmegyek minket, mielőtt átadom Dr. Robin Bloornak.

Voltunk át ezen, amit „nagyobb, jobb, gyorsabb, olcsóbb” élménynek hívok. Mint mondtam, az adatbázis meghatározása megváltozott. A táj, amelyben az adatbázis-platformoknak kellett volna foglalkozniuk a teljesítménygel, valamint a műszaki és kereskedelmi követelmények is megváltoztak. Láttuk a növekvő igényt a megoldások iránt, akár bonyolultabb kereskedelmi, akár bonyolultabb műszaki követelményekkel szemben. És tehát egy nagyon gyors áttekintés az a véleményem, hogy ez valójában azt jelenti, hogy meg kellett rendeznünk a 90-es éveket, és láttuk, hogy az adatbázis-technológiát befolyásolja az internet bevezetése, és egyfajta, amit akkoriban az interneten hívtunk. skála. Nem csak a terminálok előtt ülő emberekről beszéltünk, eredetileg a teletipikus terminálok kedveléséről, amelyekbe beépített fizikai nyomtatókkal és 132 papíroszlopon került sor. Aztán a korai zöld képernyő terminálok, lyukasztó billentyűzettel.

De tudod, a világunk hosszú ideje terminálok, soros kábelek vagy hálózati kábelek voltak, amelyek a számítógépekkel beszéltek. Aztán jött az internet, és ez a robbanásszerű növekedés a kapcsolatokban, hogy már nem kellett csatlakoztatni a számítógépet. Az adatbázis-rendszerbe való belépéshez csak egy böngészőre van szüksége. Tehát az adatbázis-technológiának drámaian meg kellett változnia, hogy a világ indexálásához használt alapvető keresőmotor-technológiáktól kezdve mindent el lehessen foglalni, és az adatbázis-formátum skáláján tárolja az információindexet. És az olyan emberek, mint a Google és mások, platformot teremtettek erre. És minden új típusú adatbázis-tárolást, lekérdezést és indexelést készítettünk. És akkor volt zenei oldalaink és filmes oldalak is.

És akkor a 2000-es években láttuk a dot-com fellendülést, és ez még drámaibb robbanást okozott az emberek számában, akik olyan rendszereket használtak, amelyeket mindig valamilyen formájú adatbázis táplált. Ebben a szakaszban a relációs adatbázisok továbbra is megbirkóztak a legtöbb terheléssel, csak nagyobb ónra tetjük őket, és egy nagyon, nagyon-nagyon nagy közepes rendszerű rendszerekhez mentünk, amelyek Unix platformokat futtattak olyan emberektől, mint az IBM és a Sun, és így tovább . A dot-com fellendülés egyszerűbbé tette a dolgokat hardver, teljesítmény szempontjából, és jelentős változások történtek az adatbázis motorjaiban, de jobb, hogy ez még mindig ugyanaz volt, mint amit egy hosszú idő.

És akkor megkaptuk a web 2.0 korszakát, ahogyan utalunk rá. És ez szörnyű váltás volt, mert hirtelen sokkal egyszerűbb adatbázis-platformokra volt szükségünk, és vízszintes formában is léteznie kellett. És ez olyan jelentős változás volt a módjában, hogy megközelítettük azt az elképzelést, hogy mi az adatbázis. Véleményem szerint még mindig nagyon felzárkózunk. És most az egész erdei problémával foglalkozunk, és azt mondom, hogy pozitív centrifugálással, nem negatív konnotációval, ez a fajta, amit nagy adatnak nevezünk, és egy hatalmas robbanás, és úgy értem, hogy robbanás. Ez a felháborító függőleges eltolódás az ábrán, amelyben az opciók száma, amikor adatbázisról beszélünk, és valamilyen típusú relációs lekérdezési képességről van szó.

És érdekes módon, személy szerint úgy gondolom, hogy a nagy adatok valójában csak a jéghegy csúcsa. Hajlamosak vagyunk egy kicsit izgatni arra, hogy mi volt a nagy adatok hatása, és milyen választási lehetőségeket kínálunk. Mindent megkapunk a NoSQL motoroktól, grafikonmotorokat, mindezeket a különféle típusú platformokat, amelyekre adatokat gyűjthetünk és meg tudunk csinálni. Még arra a pontra is, ahol az egyik legelső beszélgetés, amelyet Eric Kavanagh-nal tartottam, aki ma itt van velünk, egy olyan beszélgetés körül zajlott, amely az Apache Drill nevű dolgot érintette, amely egy nyílt forrású projekt, amely lehetővé teszi a lekérdezést adatok a modelltípus különböző adattípusai között: a merevlemezen lévő nyers CSE-fájloktól kezdve a petabata méretű HDFS fájlrendszerekig. És tudod, ez lehetővé teszi az SQL stílusú lekérdezések elvégzését mindenféle izgalmas növény strukturált és strukturálatlan adatairól.

Arra számítunk, hogy az „intelligens épület” dologvá válik, és azt szeretnénk gondolni, hogy van biztonságos és hőkezelő okos épületünk, de olyan okos épületekről beszélek, amelyek sokkal többet tudnak arról, hogy ki vagy és hol tartózkodsz, miközben sétálsz, és mindenféle ügyes dolgot csinálsz ezen a szinten, egészen az intelligens városokig - egész ökoszisztémák városi szinten -, amelyek tudják, hogyan kell okosan csinálni a dolgokat. És ezen túlmenően megvan ez a hihetetlen dolog, amelyet szerintem a világon senki sem fog megérteni, és ez a tárgyak internete formája. Az elmúlt évtizedben és egy kicsit, valószínűleg két évtizedben, körülbelül két évtized alatt, körülbelül felfelé haladva, megtörténtek ezek a változások, amelyek véleményem szerint az adatbázisoknak tekintik a világot.

Van néhány jelentős dolog, amelyek ezt még lehetővé tették. A merevlemezek költsége drámaian lecsökkent, és sok szempontból ez lehetővé tette néhány referencia-architektúra, például a Hadoop modell meghajtását, abban az értelemben, hogy sok adatot veszünk fel, és sok merevlemezre terjesztjük, és csinálj vele okos dolgokat. Valójában, ami véleményem szerint a relációs adatbázis vagy a hagyományos DB egység modell rétegződésévé vált. És a RAM nagyon, nagyon olcsó lett, és ez egy teljesen új lehetőséget adott nekünk arra, hogy különféle referencia-architektúrákkal játszhassunk, például a memóriában, és olyan dolgokat végezzünk, mint a nagyon-nagyon nagy darab adatok particionálása.

És így kapott egy kis képet, amelyet most nézünk, amely egy diagram, amely megmutatja, hogy milyen típusú platformok érhetők el, ha a nagy adatkereten vagy. És nagyon-nagyon nehéz olvasni, és ennek oka, hogy túl sok információ van erről. Olyan sokféle gyártási, modell- és gyártási lehetőség van, amelyekkel bármilyen formában be lehet tölteni az adatokat adatbázis-rendszerekbe, lekérdezni őket, és elvégezni a hagyományos olvasási-írási műveleteket. És nem mindegyikük felel meg, valójában nagyon kevés közülük is megfelel bármely alapvető stílusstandardnek, de továbbra is adatbázisnak tekintik magukat. És megmutatom neked egy pár képernyőt másodpercenként, hogy összeadjak valamilyen összefüggést azzal, amit a 90-es évek és az internet skálájáról a web 2.0-ra való átállás alatt értek, majd az egész növekedés nagy adatokon keresztül. Ha úgy gondoljuk, hogy ez a nagy adattechnológiai tájgráf izgalmas, mert rengeteg lehetőség van rajta, nézzünk csak egy függőleges kulcsot.

Nézzük meg a marketing technológiát. Itt találhatók az adatbázis-kezelő rendszerek vagy az adatkezelés lehetőségei, csak a mar-tech helyiségben, tehát a marketinghez kapcsolódó technológia. Most ez volt 2011-ben, tehát néhány évvel ezelőtt; öt évvel ezelőtt ez volt a tájkép. Ha röviden visszamenek egy diával, ez néz ki a mai adattéren a különféle márkáknál és kínálatunknál, amelyeket az adatbázis-technológiákban találunk. Így nézett ki egy vertikális öt évvel ezelőtt, csak a marketing technológia területén.

Ha most a mai nézetre megyek, ez így néz ki, és teljesen áthatolhatatlan. Csak a márkák és az opciók ez a fala, és ezer és ezer szoftverkombináció tartja magát az adatbázis-osztályban, és különféle formákban képes rögzíteni, létrehozni vagy tárolni és visszakeresni az adatokat. És azt hiszem, most nagyon-nagyon érdekes és bátor időbe lépünk, ahol egyszer megismerhették a fő márkákat, megismerhetik az öt vagy hat különböző platformot az Oracle és az Informix, a DB2 és így tovább, és majdnem egy szakértő az összes márkáról, amelyek 20 évvel ezelőtt elérhetők voltak. Tíz évvel ezelőtt egy kicsit könnyebb lett, mert néhány márka lebukott, és nem minden márka volt képes megbirkózni a dot-com boom méretével, és néhány vállalat csak tört.

Manapság teljesen lehetetlen szakember lenni az összes létező adatbázis-technológiában, legyen az akár relációs adatbázis, akár egy standard adatbázis-kezelési platform, amelyet már az utóbbi évtizedekben megismertünk. Vagy valószínűleg a legmodernebb motorok, mint például a Neo4j és az ilyen típusok. És úgy gondolom, hogy egy nagyon bátor világba lépünk, ahol rengeteg lehetőség áll rendelkezésre, és horizontális alapon léteznek platformok, akár a memóriában, akár a lemezen. De azt hiszem, hogy kihívásokkal teli idő a technológiai és üzleti döntéshozók számára, mivel nagyon nagy döntéseket kell hozniuk a technológiai halmokról, amelyek bizonyos esetekben csak lényegében hónapok óta állnak fenn. A tizennyolc hónapos nem most ijesztő szám néhány izgalmas és új nyílt forrású adatbázis-platform számára. És elkezdenek egyesíteni a platformokat, és még újabb és izgalmasabbá válnak.

Azt hiszem, ma nagyszerű beszélgetést folytatunk arról, hogy mindez hogyan befolyásolta a hagyományos adatbázis-platformokat, és hogyan reagálnak erre, és hogy milyen technológiákról van szó. És ezt szem előtt tartva, továbbadom Dr. Robin Bloornak, és megismerem betekintését. Robin, neked.

Robin Bloor: Oké, köszönöm érte. Igen, ez túlságosan nagy téma. Úgy értem, ha elvette az egyik illusztráció egy darabját, amelyet Dez éppen mutatott neked, hosszú beszélgetést folytathatott az egyik rágóról. De tudod, mehet egy adatbázisba - már az 1980-as évek óta nézem az adatbázisokat, nem tudom, és az adatbázisokat különféle módon lehet megnézni. És az egyik dolog, amit gondoltam, hogy csak a mai beszélgetésbe dobom, az volt, hogy beszéljünk arról, hogy miért zavaró dolgok történtek a hardver szintjén. És szem előtt kell tartania, hogy a szoftver szintjén is szörnyű sok zavaró dolog történt, tehát ez nem a teljes kép, hanem csak egy hardver.

Nem is beszéltem hosszú ideig, csak akartam adni neked a hardver képet. Az adatbázis adatgyűjtési képességeit foglalta magában a CPU-t, a memóriát és a lemezt, és ez drasztikusan változik. És ezt mondom azért, mert megtanultam megérteni az adatbázist a tényleges szempontjából. Tudod, különbség van a késleltetési idő között a ténylegesen a CPU-n lévő adatok, az adatok a memóriából a CPU-ba történő behúzása, valamint az adatok a lemezről a memóriába és a CPU-n keresztül. És a régi adatbázis-architektúrák csak ezt próbálták kiegyensúlyozni. Tudod, csak azt mondták: „Nos, ez nagyon lassan megy végbe, tároljuk az adatokat a lemezen, így a memóriában vannak. Megpróbáljuk ezt megtenni egy nagyon pontos módon, hogy az általunk kért adatok valóban jó hányada már a memóriában legyen. És az adatokat a CPU-ra felvesszük, amilyen gyorsan csak tudunk. ”

És a régi időkben adatbázisokat írtak, a gépeket kis klaszterek számára írták. És most, a párhuzamosság tudatlanságáért. Mert ha valamelyik teljesítményt ki szeretne hozni egy klaszterből, akkor párhuzamosan különféle dolgokat kell tennie. A párhuzamosság a játék része, a jelenlegihez hasonlóan. Csak egyfajta sétát hajtok végre, ami történt.

Először is, lemez. A lemezen valóban vége. Az adatbázisok tekintetében már nagyon sok. Úgy gondolom, hogy az adatok archiválásának számos összefüggése van, és még a Hadoopon futó nagyon nagy adattó-tavak esetében is a legrosszabb forgó lemez valószínűleg manapság életképes. Valójában a forgó lemez problémája az volt, hogy az olvasási sebesség nem javult különösebben. És amikor a CPU haladt Moore törvény sebességével, egyfajta nagyságrenddel, hatévente gyorsabban. És az emlékezet egyfajta nyomon követése volt akkor, amikor a kettő ésszerűen lépést tartott egymással, nem volt teljesen simán, de mégis.

De egy véletlenszerűen leolvasott lemezre, ahol a fej a lemez körül repül, úgy értem, hogy bármi mástól eltekintve, ez egy fizikai mozgás. És ha véletlenszerűen olvassa le a lemezt, akkor hihetetlenül lassú a memóriából való olvasáshoz képest, mintha 100 000-szer lassabb. És a közelmúltban a legtöbb adatbázis-architektúrát, amelyet bármilyen mélységben megnéztem, valójában csak sorosan olvastam a lemezektől. Tényleg azt akarja, hogy valamilyen módon gyorsítótárazzon a lemezről, amennyit csak tudsz, húzza le a lassú eszközről, és tegye egy gyors eszközre. És nagyon sok okos dolog, amit ezzel meg lehet csinálni, de ez már véget ért.

És a szilárdtestalapú lemezek, vagy a flash meghajtók valóban azok, amelyek vannak, nagyon gyorsan helyettesítik a forgó lemezeket. És ez ismét teljesen megváltozik, mivel az adatok szervezése a lemezen a lemez működésének módja szerint történik. Valójában egy forgó felületen mozgó fejről, több feje több forgási felületen mozgó fejről szól, és az adatok felvételére, amint megy. A szilárdtestalapú meghajtó csak egy blokk dolog, amelyet el lehet olvasni. Úgy értem, az első dolog az, hogy a hagyományos adatbázisokat spinning lemezekre fejlesztették ki, és ezeket most SSD-re fejlesztik át. Az új adatbázisok valószínűleg - bárki, aki most új adatbázist ír, valószínűleg figyelmen kívül hagyja a forgó lemezt, egyáltalán nem gondolkodik rajta. De a Samsung, az SSD-k legnagyobb gyártója azt mondja nekünk, hogy az SSD-k valójában a Moore törvény görbéjén vannak.

Azt hiszem, már három-négyszer gyorsabbak voltak, mint a forgó korongok, de alapvetően 18 havonta sokkal gyorsabbak lesznek. Kettős és tízszeres sebességgel, körülbelül hat évig. Ha ez csak így volt, az nem az, ahogy egy pillanat alatt elmondom. A forgó lemez természetesen archiválási közeggé válik.

A memóriáról. Először az RAM, a RAM. A RAM és a CPU közötti CPU arány csak folyamatosan növekszik. És ez természetesen bizonyos szempontból szörnyen sokkal gyorsabb, mivel a memória hektárja, amely most már rendelkezhet, sokkal többet tárolhat. Ez valójában az, hogy csökkenti az MLTP-típusú alkalmazásokra vagy a véletlenszerűen olvasható alkalmazásokra nehezedő nyomást, mert könnyebb ellátni ezeket, mert sok memóriája van, és így bármi tárolhatja valószínűleg beolvasásra kerül a memóriába. De problémákba ütközhet egy nagyobb adathalom miatt, tehát a nagy adatok valójában nem annyira egyszerűek.

És akkor van Intelünk a 3D Xpoint-kal, és az IBM azzal, amit PCM-nek hívnak, amely fázisváltó memória, valamit szállítanak, ami szerinteük jó - legalábbis tízszer gyorsabb, mint a jelenlegi SSD-k, és úgy vélik, hogy megkapja nagyon közel áll ahhoz, hogy megegyezzen a RAM memória sebességével. És természetesen olcsóbb. Tehát korábban volt ez a CPU, memória és lemez adatbázis-struktúrája, és most egy olyan struktúra felé haladunk, amely négy rétegből áll. Megvan a CPU, a memória vagy a RAM, majd egy ilyen gyorsabb, mint az SSD memória, amely valójában nem illékony, majd az SSD. És ezek az új technológiák nem illékonyak.

És ott van a HP memristorja, amely még nem létezik, tudod, mert kb. Hét évvel ezelőtt jelentették be, de még nem jelent meg. De azt a pletykát hallom, hogy a HP egy kicsit meg fogja változtatni a játékot egy memristorral is, tehát csak egy új memóriahelyzet áll rendelkezésére. Ez nem olyan, mintha gyorsabb cuccunk lenne, hanem egy teljesen új réteg. És akkor megvan az a tény, hogy az SSD-hozzáférés, elolvashatja párhuzamosan. A forgólemez párhuzamosan nem olvasható, kivéve, ha sok különböző forgólemez van. De egy SSD blokk, valójában párhuzamosan olvashat. És mivel ezt párhuzamosan el tudja olvasni, akkor sokkal gyorsabb, mint az egyszerű olvasási sebessége, ha valójában több processzt állít be a különféle folyamatok között egyetlen CPU-n, és csak az SSD-vel rendelkezik.

A becslések szerint ezáltal szinte akár RAM memória sebességet is elérhet. És mindez csak az, hogy a memória-architektúra jövője tisztázatlan. Úgy értem, a valóság az, hogy a különböző domináns gyártók, függetlenül attól, hogy kiderülnek, valószínűleg meghatározzák a hardver irányát. De senki sem tudja, hol megy ez a pillanat. Beszéltem néhány adatbázis-mérnökkel, akik azt mondják: „Nem félek attól, ami történik”, de nem tudják, hogyan lehetne optimalizálni azt a get-go alkalmazásból. És mindig kedvesen csináltál, szóval érdekes.

És akkor ott van a CPU. Nos, a többmagos CPU-k nem csak a többmagos CPU-k voltak. Jelentős mennyiségű L1, L2 és L3 gyorsítótár van, különösen az L3, amely több tíz megabájtig terjed. Tudsz sokat tenni oda, tudod. Ezért valóban használhatja a chipet gyorsítótárazó közegként. Tehát ez megváltoztatta a játékot. És természetesen a vektorfeldolgozást és az adatok tömörítését számos gyártó valóban megtette, és ezeket a cuccokat a CPU-ra húzta, hogy sokkal gyorsabban menjenek a CPU-n. Akkor megtudja, hogy a GPU-val felszerelt CPU-k nagyon jól képesek felgyorsítani az elemzést. És valóban nagyon jóak bizonyos típusú lekérdezéseknél, csak attól függ, hogy mi a lekérdezés.

Vagy készíthet táblákat CPU-kkal és GPU-kkal, vagy amint az AMD ezt jelenleg csinálja, elkészíthet valamit, APU-nak hívják, ami egyfajta CPU és GPU házasság; mindkétféle képességgel rendelkezik. Tehát ez egy másfajta processzor. És aztán az Intel nemrégiben tett bejelentése, hogy FPGA-t fognak helyezni a chipre, ez a fejembe jött. Gondoltam: „Hogy lehet a földön?” Mert ha megvan a a CPU, a GPU lehetősége, és lehetősége van a CPU, az FPGA lehetőségére - és egyébként, ha nagyon szeretné, ugyanazon a táblán egy CPU, egy GPU és egy FPGA is elhelyezhető. Fogalmam sincs, hogyan valósítana meg valamit ily módon, de ismerek olyan vállalatokat, amelyek ilyeneket csinálnak, és nagyon-nagyon gyors lekérdezési válaszokat kapnak. Ez nem olyasmi, amelyet figyelmen kívül hagyunk, ezt a tényt a már működő gyártók, és esetleg az újonnan felmerülő szállítók fogják használni. A DBMS-ek mindig párhuzamosak voltak, de most a párhuzamos lehetőségek éppen felrobbantak, mert ez lehetővé teszi, hogy ezt különféle módon párhuzamosítsd ezzel, ezzel, azzal.

Végül: méretarányosítás vagy kibővítés? A méretezés valóban a legjobb megoldás, de egyrészről. Sokkal jobb csomópont-teljesítményt érhet el, ha egyszerűen optimalizálhatja a processzor és a memória teljesítményét egy csomóponton. És kevesebb csomópontot fog használni, tehát olcsóbb lesz, igaz? És könnyebb lesz kezelni. Sajnos ez egy hardvertől függő kialakítás, és a hardver megváltozásával egyre kevésbé lesz lehetséges ezt megtenni, hacsak a mérnökök nem tudnak olyan gyorsan futni, amíg a hardver változik. És munkaterheléssel kapcsolatos problémák merülnek fel, mert amikor növeli a léptékét, különféle feltevéseket tesz arra vonatkozóan, hogy mi a munkaterhelés.

Ha méretezi, azaz ha az építészet hangsúlyozza a méretezést, mielőtt a méretarányozást megtenné - valójában mindkettőt meg kell csinálnod, csak azt kell hangsúlyozni. Akkor jobb hálózati teljesítményt fog elérni, mert az építészet foglalkozik vele. Hardver szempontból drágább lesz, mivel több csomópont lesz, de kevesebb lesz a munkaterhelés és rugalmasabb a kialakítás.

És azt gondoltam, hogy beledobom, mert ha valóban az összes hardverváltozásra gondol, akkor csak az ujjamra mutattam, és aztán gondolkodtam, hogy fogsz kibővíteni és kibővíteni ezeket a dolgokat? Akkor rájössz, hogy az adatbázis-mérnökök véleményem szerint legalább jól fizetnek. Tehát, ha csak a hardver rétegre gondol, az adatbázis kihívásai egyértelműek. Ezt továbbadom Bertnek, aki mindannyian oktatottnak érzi magát.

Eric Kavanagh: Ez az! Bert?

Bert Scalzo: Nagyon köszönöm. Hadd menjek egyenesen ezekbe a diákba. Nagyon sok dián kell átmennem, így nagyon sokon valószínűleg gyorsan megyek át. Erről a „Forward Momentum: Moving Relational Beyond Traditional” -ról fogunk beszélni. Ez már nem az apád adatbázisa. A dolgok megváltoztak, és ahogy egy korábbi felszólaló elmondta, az elmúlt hat-hét évben a táj radikálisan megváltozott.

Magam, a 80-as évek közepe óta dolgozom adatbázisokkal. Írtam könyveket az Oracle-ről, az SQL Serverről, a benchmarkingról és még sok más dologról. „A világ nagyon gyorsan változik. A nagy nem fog megverni a kicsit. Ez a gyors lassú verés lesz. ”Hozzáadtam az„ alkalmazkodni ”-t. Rupert Murdoch-tól származik. Nagyon hiszem, hogy ez igaz lesz. Nem lesz képes adatbázis-dolgokat készíteni úgy, ahogy 10, 15, 20 évvel ezelőtt. Úgy kell csinálnia, ahogy az üzleti vállalkozás most akarja.

Megpróbálok kicsit általános maradni a bemutatott témában, de a legtöbb szolgáltatás, amelyről beszélek, az Oracle-ben található, az SQL Server, a MySQL, a MariaDB és a többi nagy játékosok. A relációs adatbázis forradalma, én ismét egyetértek a korábbi felszólalókkal. Ha jól nézel ki 2010 körül, akkor a piros versenyautóról a sárga versenyautóra mentünk. Jelentős változás történt, és jöjjön 2020-ra, azt hiszem, újabb radikális változást fog látni. Nagyon érdekes időben vagyunk.

Most ez a dia kulcs, ezért raktam oda oda egy kulcsot. Ez a változás folyamatban van, a bal oldalon van technológiám, a jobb oldalon pedig üzletem. És a kérdés az, hogy melyik okozza melyiket, és melyik támogatja melyiket? Mindezek a hardverváltozások megvannak: lemezeket jönnek le, megnövekszik a lemezek mérete, új típusú lemezeket, tehát ezt a korábbi hangszórók is lefedték. A memória árának csökkenése, az adatbázisok mindegyik újabb verziója. De a jobb oldalon van adatvédelem és megfelelőség, adatraktározás, üzleti intelligencia, elemzés, kötelező adatmegőrzés. Az egyenlet mindkét oldala halad, és az egyenlet mindkét oldala felhasználni fogja ezeket az új funkciókat.

Először is, megvan a tipikus SAS forgólemezünk, most akár 10 terabyte-ot is meg tudnak hozni. Ha még nem látta, a Western Digital, a HGST rendelkezik úgynevezett héliummeghajtóval, amely jelenleg kb. 10 terabyte-ra megy. A forgó korong költsége egyre alacsonyabb lesz. Mint már korábban említettük, körülbelül két terabyte-os szilárdtest lemezeket is beszerezhet, de a Samsungnak hamarosan megjelenik egy 20 terabyte-os egysége. A költségek ésszerűvé válnak. Az egyik, amit a többiekről nem fogok beszélni, a flash disks koncepciója. PCIe, azaz a PCI Express, szemben az NVMe-val, lehet, hogy nem hallottál erről a, nem felejtõ memória kifejezésre. Alapvetően az NVMe helyettesíti a SAS-t és a SATA-t, és valójában inkább kommunikációs protokoll, mint bármi más. De ezeknek a lemezeknek körülbelül három terabájtja van.

Lehet, hogy látta, hogy néhány SAS-meghajtó U.2 csatlakozókkal érkezik, amely különbözik a SAS vagy SATA csatlakozóktól, és amely az NVMe-t egy szabványos lemezzel támogatja - a lemezt is természetesen támogatnia kell. Aztán a SATA az M.2 csatlakozókkal, és ezek kezdik el kapni az NVMe-t. Valójában vannak olyan notebook-gyártók, amelyek ma már olyan notebook-okat árusítanak, amelyekben NVMe flash-lemez van, és ezek a dolgok sikoltozni fognak a korábban használt technológiához képest.

Sokan nem tudják, mi ezek a különféle villanások. Ha a jobb alsó sarokban nézel, akkor ez egy példa egy M.2-re. Ön azt mondhatja: „Hát gee, ez nagyon hasonlít az bal oldalán lévő mSATA meghajtóra.” De mint láthatja, két rés van a csapokban, szemben egy, és egy kicsit nagyobb. És az M.2 háromféle méretben is kapható.

Aztán a PCI Express és az NVMe vaku. Most az NVMe flash is PCI Express, de a PCI Express általában továbbra is egy SAS- vagy SATA-típusú vezérlő algoritmus, amelyet a forgó lemezen írtak, az NVMe pedig az algoritmusok vagy technikák, amelyeket kifejezetten a flash-re írtak. És megint meg fogja látni mindezeket.

Az NVMe nagyon sok dolgot kínál. Úgy gondolom, hogy a két legnagyobb fejlesztés a jobb felső sarokban van, a késés akár 70 százalékkal csökkent. Valójában még ennél is magasabb láttam. Ezenkívül, ha a jobb alsó sarokban nézi, amikor az operációs rendszer az NVMe lemezzel beszél, akkor sokkal kevesebb szoftverszintre megy keresztül. Alapvetően az NVMe illesztőprogramon megy keresztül, amelyet most az operációs rendszer tartalmaz, és egyenesen a médiával beszél. Sok oka van annak, hogy ez a technológia radikálisan megváltoztatja az adatbázis-világot.

És sokszor az emberek azt fogják mondani: „Nos, milyen gyors az NVMe?” Tudod, a régi jó időkben, 2004-ben és azt megelőzően, nagyon izgatottak vagyunk, ha Ultra-320 SCSI-vel rendelkezünk, 300 megabájt másodpercenként. A mai sebességgel valószínűleg sokan vannak a száloptikán vagy az InfiniBand készüléken, és ilyenek is. A jobb oldalon lévő NVMe ott kezdődik, ahol a jelenlegi technológiák véget érnek. Amit én keresek, az a PCI Express 3.0 nyolc sávos összeköttetéssel kezdődik majdnem 8000-nél, és felmegy, ahogy a PCI Express újabb verzióit, a negyedik és így tovább kapjuk. Az NVMe-nek csak felfelé kell mennie.

Most mi a változás az adatbázisban? A diák jobb felső sarkába helyeztem az üzleti okokat, amelyekről azt gondolom, hogy a technológia megmutatkozott. Ebben az esetben az adattárolás és a kötelező adatmegőrzés szabályozási indokai miatt az adatbázisok tömörítést kezdenek bennük. Most egyes adatbázisok tömörítést kínálnak kiegészítőként, mások beépítettként a szabványhoz, mondjuk, az adatbázisuk vállalati kiadását, és mégis, egyes adatbázisoknak, például az Oracle-nek, még a tömörítés még jobb verziója is lehet, amely mondjuk az Exadata platformon, így valójában olyan hardvert építettek, amely képes támogatni egy nagyon speciális tömörítést, és hogy például az Exadata-ban egy 40x-es tömörítési arányt kapnak, tehát ez nagyon jelentős. És azt hiszem, ez a kötelező adatmegőrzés, az emberek csak hosszabb ideig akarnak adatokat. A vállalkozások számára az elemzés és a BI elvégzéséhez az elmúlt 5, 10, 15 év adataira van szükségük.

Most egy másik szolgáltatás, amely a 2008-as, a 2009-es időszak körül kezdett megjelenni, a particionálás. Meg fogja találni ezt az olyan adatbázisokban is, mint az Oracle, az SQL Server, és mindkettőben meg kell fizetni érte. Az Oracle-ben meg kell vásárolnia a particionálási opciót, az SQL Server-ben pedig az adatközponti kiadásnak kell lennie. Ez a hagyományos osztás és meghódítás technikája, és amit csinálsz, az az, hogy van egy logikus nagy asztal fogalma a tetején, és amikor lemezre helyezi, valójában vödörre bontja. És láthatja, hogy ezeket a vödröket bizonyos szétválasztási kritériumok szerint rendezik, általában hivatkoznak vagy nevezik a particionálási függvénynek, majd hasonlóképpen az al-partíciókat egyes adatbázis-platformokon is elvégezhetik, és tovább menhetnek.

Ismét úgy gondolom, hogy mind az adattárolás, mind a kötelező adatmegőrzés ezt megmozdította, és ezen adatbázisok némelyikében akár 64 000 partíció is lehet, és néhány más adatbázisban akár 64 000 alpartíciót is hiszek. Ez lehetővé teszi az adatok kezelhető részekre bontását. Az indexeket is particionálja; ez egy lehetőség, nem kell, de megoszthatja az indexeit is. Ennek egyik oka az lehet, hogy csúszó adatablakkal rendelkezik. 10 évnyi adatot szeretne megőrizni, de ahhoz, hogy az indexeket a ma esti kötegelt terhelés futtatásához elengedje, nem akarja, hogy az indexeket minden egyes sorban eldobja, csak az aktuális vödörben lévő sorokon. A particionálás valójában nagyon jó adminisztratív eszköz, annak ellenére, hogy a legtöbb ember úgy gondolja, hogy nagy előnye a partíciók kiküszöbölése a tervekben, és ezért a lekérdezések felgyorsítása. Ez tényleg egyfajta jegesedés a tortán.

Most valószínűleg hallott a szilánkokról és valószínűleg azt gondolja: „Nos, miért tetted ide ezt a diát?” Ez egyike a NoSQL-knek - ez az egyik ilyen Hadoop típusú környezet. Az Oracle 12c kiadott egy kettőt, amely még nem G8, de amelyben megjelenik vagy megtekinti, valójában szilánkok vannak. Lesz olyan tradicionális adatbázisrendszered, mint az Oracle, és képes lesz olyan szilánkokra, mint a Hadoop modellben, és így lesz még egy osztás-és-hódítás-technika, amely osztja a Táblázat sorba sorolva, csomópontonként csoportosítva, és így lesz - pontosan úgy, mint amit néhány NoSQL adatbázisban látsz. És valójában a MySQL, ezt valójában sokkal megvalósíthatja valamelyik klaszterezési módszerrel, de ez egy hagyományos adatbázishoz érkezik, és azt hiszem, hogy a Microsoft nem akarja, hogy elmaradjon. Ez a két játék állandóan ugráló béka játszik egymással, így arra számíthatnék, hogy az SQL Server következő verziójában látom a szilánkot.

Adatok életciklus-menedzsmentje, ismét kötelező adatmegőrzés, de üzleti intelligencia és elemzés szempontjából is. Valójában ez egy split-and-conquer technika, és általában a DBA-k ezt manuálisan végzik, vagyis: “Az idei adatokat gyors lemezekről fogom megőrizni, a tavalyi adatokat kissé lassabb lemezekről, talán megyek hogy az előző két évet még lassabb lemezeken tároljuk, és akkor lesz valamilyen archiválási módszer. ”Általában nem szalagos, általában - van valamilyen hálózathoz csatlakoztatott tároló vagy olyan eszköz, amely sok tárhely, és, tudod, költséghatékony, de még mindig forog.

És így most valójában - mind az Oracle, mind az SQL Server esetén - megvásárolhat egy lehetőséget, ahol meghatározza a szabályokat, és ez automatikusan megtörténik a háttérben. Többé nem kell forgatókönyveket írni, semmit sem kell tennie. És ha láttad az SQL Server 2016-at, amely csak június elején jelent meg, létezik egy új szolgáltatás, az úgynevezett „Stretch Databases”, amely alapvetően lehetővé teszi: a jobb alsó sarokban - több rétegből közvetlenül a felhőbe mozoghat. és ismét, ez egy olyan szolgáltatás, amely be van építve az adatbázisba, csak azt mondja, hogy: "Ha az adatok több mint 365 napos, kérjük, helyezze át a felhőbe, és tudja, automatikusan végezze el nekem."

Ez egy igazán hűvös szolgáltatás lesz, sőt azt gondolom, hogy valószínűleg az lesz, amit látunk a jövőben, azaz hibrid adatbázisok lesznek, ahol néhány helyi és néhányan a felhőben. Ezt megelőzően az emberek arra gondolkodtak: „Ó, vagy én vagyok a helyszínen, vagy a felhőn.” Most a két technológia házasságát láthatjuk ebben a hibrid módon. Azt hiszem, ez elég nagy lesz, és a Microsoft odaért oda.

Helyesbítés, ennek oka az adatvédelem és a megfelelés. A régi jó időkben azt mondhattuk: „Hé, alkalmazásfejlesztő, amikor ezt a jelentésben jeleníti meg, amikor ezt a képernyőn jeleníti meg, itt van néhány biztonsági dolog, amelyet ellenőriznie kell, és kérlek, tudod, csak az adatokat jelenítse meg állítólag látniuk vagy elrejteni azokat az adatokat, amelyeket nem szabad látniuk. ”Nos, mint általában, amikor az alkalmazásba tolja, akkor nem egy helyen készítik el, így másképp történik, vagy pedig nem. Egyes helyeken nem történik meg. És tehát most ezt a képességet valójában megszerezte az adatbázis-rendszerekben.

Most, az SQL Server 2016-ban, ez a szolgáltatás be van építve, úgy vélem, hogy ez még nem opcionális költségtétel, amely még az adatközpontban van; és az Oracle 12-ben meg kell vásárolniuk az életciklus-menedzsment kiegészítőt, de ez valami új, és ismét az üzlet vezet. És főleg azért, mert most annyi adatot tárol, és az adatbányászatot végzi, azaz a BI-t és az analitikát, meg kell ismernie, hogy kihez milyen adatokhoz fér hozzá, és arról, hogy csak láthatják őket.

Hasonlóképpen, ismét vizsgáljuk meg az adatvédelmet és a megfelelést. Megállapítja, hogy sok adatbázis-rendszer tömörítést készít, vagy sajnálom, közvetlenül az adatbázisba történő titkosítást, és mi a fontos a titkosításnak, ha a lefelé mutató nyílra és a felfelé mutató nyílra nézi azt a rajzot, amely azt írja a titkosított lemezen, majd visszaolvassa a memóriába, és visszafejti. Valójában ez egy modell, van egy másik modell, amely, tudod, valójában csak akkor teszi meg, ha az adatokat az egész hálózaton keresztül továbbítja a tényleges kliens alkalmazáshoz.

Ebben az esetben még a memóriában lévő adatbázis-kiszolgálón is lehetne titkosítva, és csak akkor lehet visszafejteni, amikor az ügyfélalkalmazásra továbbítják. Kétféle modell létezik itt, és ezeket megtalálja az adatbázisokban, és valójában az egyik, a közelmúltban hozzáadott adatbázis a MariaDB volt a 10.X verzióban; Azt hiszem, most már 10.1 vagy 10.2-en vannak. És valójában némi benchmarkingot végeztem erre a titkosításra, és annak érdekében, hogy ezt a titkosítást megkapjam, csak körülbelül 8% -kal tapasztaltam meg az átviteli sebességet vagy a sebességet. Egy benchmarking teszt során a titkosítás nem okozott ennyit, tehát ez egy nagyon hasznos szolgáltatás.

Most már említettük a flash memóriáról, az SSD-ről és hasonló dolgokról. Az Oracle és az SQL Server egyik olyan funkciója, amelyet sok ember nem ismer fel: készítsen egy flash-et vagy SSD-t, amely az adatbázis-kiszolgálón található, és azt mondhatja az adatbázisnak: “Használd ezt, mintha memória lenne. A RAM-ot részesítse előnyben, de úgy tesz, mintha ez a lassú memória lenne, és ezt hosszabbító gyorsítótárként használja. ”Most az SQL Server 2014-ben jelent meg, és„ pufferkészlet-kiterjesztésnek ”hívták, ez ingyenes. Az Oracle-ben a 11g R2-ben jelent meg, „Database Flash Cache” -nek hívták, és ott is ingyenes volt.

Azt tanácsolom azonban, hogy gondosan tesztelje ezt a funkciót. Minden alkalommal, amikor megnöveli a gyorsítótárat, amikor keresni kezdi, hosszabb ideig tart. Ha betesz egy három terabyte-os flash kártyát, és azt mondja az adatbázishoz: “Add hozzá a memóriájához”, valószínűleg azt tapasztalja, hogy valami lelassult, mert a betekintési és látási idő miatt villanás van, piszkos vagy tiszta? Van értelme a visszatérés csökkentésének. Azt tanácsolom, hogy ismét próbáljam ki ezt, nézd meg, mi működik az ön számára, de megint az adatbázisban, és az Oracle esetében, mind az SQL Server, mind az Oracle esetében, már néhány éve ott van.

És akkor elvezet minket az unokához, amely a memóriában lévő adatbázis volt, és azért, mert az adatbázisárak csökkentek. A másik ok, amelyet valószínűleg úgy gondolja, hogy ez megtörtént, az elemzők nagy része megköveteli, hogy az adatoknak nagyon gyorsan hozzáférhetőek legyenek, és ezért a memóriában kell lennie. Ne feledje, hogy az algoritmusok, amelyeket az adatbázisok használnak ezekhez az adatokhoz való hozzáféréshez, tömörítéshez, titkosításhoz és tároláshoz, bizonyos esetekben tudja, hogy egyes adatbázisok továbbra is sorban tárolják a memóriában.

Bizonyos esetekben egyes adatbázisok oszlopközpontúak lehetnek, és ennek oka az, hogy sokkal magasabb tömörítési szintet érnek el, valahol a 11 és 12X között, oszlopok sorrendjében, illetve sorrendben történő tárolásával. Ez először az SQL Server 2014-ben jelent meg, Hekaton-nak hívták. Az SQL Server 2016-ban radikálisan növelték. Néhány különféle névvel hivatkoznak rá, és az Oracle 12c-ben jelent meg; Azt mondom, hogy itt a második kiadás, nem az R2. Az Oracle 12c kétféle kiadása volt: a 12.1.0.1 és a 12.1.0.2. Ez az adatbázis R1 verziójának második kiadása.

És ahogyan meghatározza, a memóriában lévő objektum hasonló mindkét adatbázisban. Itt látható a jobb felső sarokban, SQL Server-et készítek, és láthatja, hogy az optimalizált memóriával és a tartóssággal csak séma. Nem megyek át ezekre a szintaxis jelentésekre, és az Oracle-ben ez valójában még egyszerűbb: változtasson meg egy táblát és mondja meg a memóriában vagy sem, és megváltoztathatja. Mondhatom, hogy ma a memóriában van, holnap nem és így nagyon rugalmas.

Végeztem néhány tesztet az Oracle-n a memóriában lévő táblákkal, volt néhány tesztem, amelyeken csaknem 40 perc futott, ott a felső sorban. Most az a fontos, hogy mire eljuttam a két alsó sorba, megnöveltem a futási időt, vagy azt kellene mondanom, hogy kb. Öt percre csökkentem, és amikor megvizsgáltam a tömörítési tényezőt, a memóriában lévő adatok valójában 3, 6 voltak. 4, 6-szor kisebb. Ez azért fontos, mert ebben az esetben oszloporientált formátumot használtam, és ez a tömörítés. És hát kitaláld mi? Valójában csaknem négy-ötször annyi adatot illesztettem a memóriába. Nemcsak a memória előnyeit, az oszloporientált előnyöket élveztem, hanem a sokkal több adat előnyeit is - akár ötször annyi adatot is a memória-gyorsítótárban, tehát ez egy nagyon hatékony technika. Az Oracle és az SQL Server ismételten meg akarja nézni ezeket, ezek nagyon jó funkciók. És ezzel azt hiszem, kérdéseket nyitok meg.

Eric Kavanagh: Nos, Bert, mindenekelőtt nagyon önzetlen voltál ebben a csodálatos oktatásban. Beszélne egy percet arról, hogy mit csináltok? Mert van olyan engedélyezõ technológiája, amely megkönnyítheti azt, amirõl beszélt. Csak beszéljen egy percet arról, amit csináltok, majd engedje le Dezt és Robint az itt megadott egyenletbe.

Bert Scalzo: Igen, IDERA nevű cégnél dolgozom. Texasban vagyunk, székhelyünk Houstonban van, és jelenleg Austinban ülök, de Dallasban vagyok. Készítünk adatbázis-eszközöket és adatbázis-eszközöket a problémák megoldásához. Ez a probléma lehet olyan egyszerű, mint a termelékenység. Ebben az esetben van egy DBArtisan nevű eszköz, amely lehetővé teszi az adatbázis adminisztrációs feladatainak elvégzését, és ez az egyik eszköz a 12 különféle adatbázis-platform kezelésére. Tudom kezelni az SQL Server alkalmazást, az Oracle-t, a MySQL-t, a DB2-t, a Postgres-et, és egy eszközt, egy végrehajtható, egy grafikus felhasználói felületet és egy következetes munkafolyamat-készletet használhatok. Készítünk eszközöket a megfelelés elvégzéséhez is, és van egy SQL Compliance Manager nevû eszköz, amely segít megfelelni a megfelelési igényeinek. Egy másik eszköz, az SQL Security nevű eszköz, ezért megpróbálunk olyan eszközöket készíteni, amelyek hatékonyságot és eredményességet nyújtanak Önnek, és ami igazán jó, ha ellátogat weboldalunkra, akkor egy csomó ingyenes szoftver van odakinn, tehát ha semmi más, akkor töltse le a letöltést - Azt hiszem, van 20 vagy 25 ingyenes alkalmazásunk. Van néhány igazán jó freeware cucc, mint például egy SQL Server és a Windows Súgó, amely csak alapvetően megnézi, mi van, és megmondja, vannak-e problémái vagy dolgai, és teljesen ingyenes.

Eric Kavanagh: És igazán kedves …

Bert Scalzo: Minden bizonnyal az első cucc -

Eric Kavanagh: A mai piacon a heterogenitással beszéltek. Régen volt egy mindenki számára megfelelő egyenlet, amely valójában emlékszem, hogy Dr. Michael Stonebrakerrel interjút készítettem vissza, amikor 2005-ben, amikor folytatta egy nagy lökést beszélt az oszlopközpontú adatbázis-mozgalom ítéletéről, és arról beszélt, hogy évek óta uralkodott az egyméretes relációs modell, és azt jósolta, hogy ez mind megváltozik, és a fiúnak igaza van hogy. Most van ez a nagyon változatos és érdekes környezet, rengeteg különféle lehetőséggel és lehetőséggel, de szükség van valakire mindezek kezelésére, és számomra úgy tűnik, hogy a vállalkozása elég aktívan összpontosít a matematikai problémák megoldására, és ezáltal lehetővé teszi a a heterogenitás fejléce, ugye?

Bert Scalzo: Teljesen. Úgy értem, hogy mindig lesznek olyan DBA-k, akik azt mondják: „Nem akarok GUI eszközt használni, mindent megteszek szkriptekkel”, tudod? Úgy gondolják, hogy ők a DBA supermens típusai, és ez rendben van, de az emberek többségének azt akarjuk, hogy csak munkát végezzünk, és - tudod, a Microsoft Word használatával írom a dokumentumaimat. A Microsoft Outlook programot használom az e-mailek elkészítéséhez. Úgy értem, rendelkezem eszközökkel a feladatok elvégzéséhez. Ugyanazt a koncepciót építjük ki, eszközöket építünk az adatbázis-adminisztrátorok és fejlesztők számára, hogy segítsenek nekik arra összpontosítani, hogy mit akarnak csinálni, és nem arra, hogy hogyan kell csinálniuk.

Eric Kavanagh: Ennek van értelme, de hadd forduljak a szakértőinkhöz, és az emberek bátran belemerüljenek. Van néhány megjegyzés a közönség részéről. Talán Dez, néhány kérdés és Robin pár kérdés?

Dez Blanchfield: Persze. Az egyik első kérdés, amelyet rád akarok dobni, tekintettel a kapott óriási tapasztalatokra, lát-e hamarosan egy olyan időpontot, amikor ezek közül valamelyik lelassul? Vagy Ön szerint valóban csak a folyamatos növekedés változási vonalának belépési pontján vagyunk? Úgy gondolom, hogy az egyik legnagyobb probléma, amellyel a vállalkozások szembesülnek, és mindig azok az emberek, akik megpróbálják támogatni a technológiát, amelyet azoknak a vállalkozásoknak a működtetésére bocsátanak, az, hogy a változás olyan drámai, hogy egyszerűen nem tudnak lépést tartani mindennel a különféle funkciók és szoftverek, rendszerek és keretek, valamint architektúrák és új kód jelenik meg, majd alatta található hardver, látja-e, hogy a jelenlegi változási sebesség egyre lassul? Úgy értem, olyan széles platformokkal foglalkozik, amelyekkel a teljes IDERA-készlettel foglalkozunk, hamarosan lelassulunk, vagy már hosszú ideje belemegyünk ebbe az őrült elrohanó tehervonatba?

Bert Scalzo: Azt hiszem, hogy a növekedési görbe első 20 százalékánál vagyunk, és még hosszú utat kell megtennünk, és két tényező szorítja azt. A technológia folyamatosan fejlődik. Megemlítette az új memória típusokat, amelyek megjelennek, ez fantasztikus lesz. A Samsungnak hamarosan valójában itt lesz egy 20 terabyte-os flash meghajtója. Ez megváltoztatja a dolgokat. Megvan az összes NoSQL és felhőadatbázis, ez csak folytatódni fog. Az a dolog, ami nagyon vicces, az az, hogy amikor olyan adatbázisokat nézek meg, mint az Oracle, az SQL Server és néhány más, ezek valójában már nem relációs adatbázisok. Nem strukturált adatokat tudok betenni az Oracle-be, és mégis fenntartani az ACID-megfelelőséget. Ha azt mondtad volna nekem 20 évvel ezelőtt, akkor azt mondtam, hogy drogot szed.

Dez Blanchfield: Igen, igen, nagyon jóak . Nos, még azoknak a motoroknak a most is, amelyek meglehetősen szép niche-vertikális helyzetűek, mint például a GIS, csak jobb, mint a natív képesség. Nagyszerű megjegyzéseket fűzött a kihívásokhoz, amelyekkel a DBA-k szembesülnek, és a DBA-k különböző időszakaival, amelyeket reméljük, hogy látni fogunk a hely körül, de hogyan néz ki a világ a vállalkozás ilyen rétegével, amellyel foglalkozik? Úgy értem, ezek azok az emberek, akik a diagnosztikai kezelőtől a leltárkészítő eszközökig és a lebontásig egészen a platformon keresztül használják a különböző platformokat, hogy a DBA-k hogyan viselkednek ezzel a változással, és hogyan viselkednek?, mit csinálnak az Ön eszközeivel, hogy megbirkózzanak a táj jelentős változásával?

Bert Scalzo: Nos, majdnem 20 évvel ezelőtt visszamegyek, akkor azt mondom, hogy a DBA-k nagyon konkrét szerepet játszanak egy szervezetben. Általában egy, akár talán kettő adatbázis-platformon működnek, és viszonylag kevés adatbázist kezeltek. Most tovább haladva a mai napig és az adatbázis-adminisztrátornak, valójában 10 adatbázis-platformot fog megismerni. Bizonyos esetekben ezer adatbázist kezel, és ez nem vicc. inkább az SQL Server világában vagy a MySQL világában. De az Oracle világában mégis több száz adatbázist kezelhetnek. És így megjelent az összes új szolgáltatás, megjelent az összes új platform, és megvannak az összes ezek az adatbázisok, amelyekért felelősek. Olyan eszközöket keresnek, amelyek lehetővé teszik termelékenységüket, és segítenek nekik is megtanulni néhány dolgot.

És hozok egy példát - ha egy táblát particionálni akarok, az elég homályos szintaxis, és ha fel szeretném osztani, akkor a szintaxis még nehezebbé válik. Tudom, mit akarok csinálni, vödröket akarok készíteni. Ha van egy olyan eszköz, mint a DBArtisan, amely azt mondja: „Hé, itt van egy szép képernyő, amely lehetővé teszi, hogy koncentrálj arra, amit próbálsz csinálni, nem pedig arra, hogyan próbálsz csinálni, és egyébként, nyomja meg a Mutassa meg az SQL gombot, amikor elkészült, és megmutatjuk, mi volt az SQL, így elkezdheti valóban megtanulni és elsajátítani ezt. ”

A DBA-k úgy találják, hogy az olyan eszközök, amelyek segítenek nekik elvégezni a munkát, ugyanakkor megtanítják nekik ezeket az új dolgokat is, amelyeket használnak, és ugyanez igaz lenne - mondjuk, hogy Oracle srác vagyok, és átmegyek a MySQL-hez, és azt mondom: - Oké, hozzon létre egy adatbázist, DBArtisan. Most mutassa meg az SQL-t, mert kíváncsi vagyok, hogyan hozhatunk létre adatbázist a MySQL-en, és csak megtanultam a szintaxist. ”És így nemcsak az adatbázis átvitelén segítünk, hanem az egész adatbázisban is oktatjuk őket.

Dez Blanchfield: Még ennél is érdekesebbé válik, ha meglátogat egy modernitást - vagy nem modernit, ez nem igazságos dolog mondani -, de egyszer az adatbázis egy adatbázis. Manapság látok mindent, amiről beszélt, azzal a további kihívással, amelyet a technológia halmoz fel, amelyet hagyományosan látunk az eladóktól és a fajta nyílt forráskódoktól, valamint azt, hogy ők is jók. Nem csak az adatbázis-motorokkal és a lekérdezési nyelvekkel foglalkoznak, hanem az adattípusokkal, a strukturált és strukturálatlan adatokkal is foglalkoznak, tudod, a kihívással, hogy mindent meg kell kezdeni a multi-petatajtás HDFS spektrumának legtávolabbi végétől kezdve. környezet a kis apró tárolókhoz, valamint a csomagfájlokhoz és a különféle naplófájl-formátumokhoz.

És azt hiszem, ez most valami olyan, amit látunk, ahol egyetlen ember sem létezik, függetlenül attól, hogy mennyi ember vagy ember, akármennyire is gondolnak ők, fizikailag, csak nem tudnak mentálisan foglalkozni ezzel a változási sebességgel és a variációk skálája. Úgy gondolom, hogy az Ön által most kínált eszközcsomag olyan pontra jut, ahol szinte alapértelmezett készletre kerülnek, így nem tudjuk futtatni az adatbázis-környezeteket, amelyek nélkül rendelkezünk velük, mert csak fizikailag nem tudja rájuk dobni sok testet. Nagyon élveztem a bemutatót. Átadom Dr. Robin Bloornak, biztos vagyok benne, hogy rengeteg kérdése van rá, hogy felvegye magát is.

Robin Bloor: Oké. Nos, természetesen vannak kérdéseim. Bert, nem tudom, merre tartasz - pár nappal ezelőtt egy igazán érdekes beszélgetésem volt, ahol valaki elkezdett mesélni nekem a DU legújabb adatvédelméről, és azt mondták nekem, hogy hihetetlenül hihetetlen. drakonikus azokban a dolgokban, amelyekre ragaszkodtak. Kíváncsi voltam, vajon ezt valóban megnézted-e; valami olyasmit ismersz?

Bert Scalzo: Teljesen. Igen.

Robin Bloor: 2016, Oké, mondja el nekünk.

Bert Scalzo: És valójában én …

Robin Bloor: Mélyen érdekes.

Bert Scalzo: Valójában egy ideig flash- gyártóként dolgoztam, az adatbázisuk területén segítettem őket flash-termékek adatbázisok készítésében, és elmondhatom, hogy a draconian teljesen lement. Amit értem, ha emlékszel az egyik diájára, azt mondtam, hogy néhány adatbázisban titkosítást fog végezni, de behelyezi a szerver memóriájába és egyes adatbázisokban a titkosítást - még mindig titkosítva van a szerver memóriájában, csak akkor kerül visszafejtésre, ha megkapja az ügyfélnek. Nos, ezek közül néhány a kormányzati szabványok közül is, különös tekintettel az Egyesült Államok Védelmi Minisztériumára vagy a katonaságra, ők is végigmennek a vaku szintjéig, és nemcsak azt akarják tudni, hogy támogatják a titkosítást és a visszafejtést a hardvert, de ha valaki ellopta a chipeket - tudod, kihúzta őket a dologból, a szerveréből -, hogy mi van titkosítva, és így annak ellenére, hogy megvan nekik a tárolójuk, az nem lehet, és egészen a tényéig - nem magához a vaku részhez, hanem az egyes zsetonokig. Tudni akarták ezt a chipek szerint, mindent titkosítva.

Robin Bloor: Wow. Úgy értem, nagyon sok olyan dolog van - tudod, azt hiszem, hogy csak egy vagy két diát hozott létre -, de ez valami, egy forgatókönyv, amely szerintem igazán érdekes. Például az információk szerkesztésével egy kicsit okosnak kell lennie, mint a különféle mezők elfedésének, mert manapság különösen a gépi tanulással olyan deduktív dolgokat végezhet, amelyek lehetővé teszik az olyan információk felületét, amelyeket korábban nem tudtak felmutatni.

Ha meg akar védeni, mondjuk az egészségügyi információkat, akkor ez egy nagyon, nagyon drasztikus szabály az Egyesült Államokban az egészségügyi információk vonatkozásában, de valójában különféle gépi tanulási technikák alkalmazásával gyakran kitalálhatja, kinek van valaki orvosi információja. valójában az. Csak azon töprengett, vajon van-e mit mondani erről, mert mindannyian azt gondolják, hogy ez egy érdekes terület.

Bert Scalzo: Igen, abszolút, és ezt csak példaként használom, nem próbálom azt mondani, hogy az egyik adatbázis jobb, mint egy másik, de ez egy nagyon jó példa erre, amit éppen kérdezett. Az Oracle-ben, ha például nem szabad megragadnom az adatsort, mint például a John Smith egészségügyi nyilvántartása. Az Oracle-ben, ha azt mondom: „Válassza ki ezt a rekordot”, blokkolva leszek, vagy engedélyezni fogom, hogy megtekintsem azt, amit láthattam, és szerkeszteni fogom. És ha azt mondom: „Válasszon egy fiókcsillagot az asztalból, ahol megegyezik John Smith-szel”, akkor nulla lesz.

Az SQL Serverben képes elvégezni a szerkesztést, de van néhány lyuk. Ha azt mondom: „Válassz ki egy fiókcsillagot az asztalból, ahol ez megegyezik John Smith-szel”, valójában visszatérek egyet, tehát tudom, hogy van John Smith. Az egyik biztonságosabb, mint a másik. Most azt várom, hogy ezt javítsák ki, mindig ugró béka játszik egymással. És ismét: nem azért próbálom különbséget tenni az adatbázisok között, ha példát mutatok - nézzük meg, miről beszélünk, valami olyan egyszerűt, mint a kiválasztott fiók, a szerkesztéssel is le kell vágni, bár műszakilag szólva, egyetlen oldalt sem szerkesztnek, csak a sor léte.

Robin Bloor: Igen, igaz. Ez nagyon érdekes. Úgy értem, egy másik általános kérdés, mivel nem sok időm van, valójában csak a fejlesztésekről szól. Úgy értem, már olyan voltál, ahol tudom, hogy példákat mutatott nekünk a futtatott különböző teszteredményekről - gondolod, hogy a hagyományos adatbázisok, nevezzük őket domináns adatbázisoknak, az SQL Server és az Oracle, Gondolod, hogy tovább fognak maradni a befejezés előtt? Vagy úgy gondolja, hogy valójában el fognak fogni egy vagy több különféle zavar a piacon, amelyek valóban nekik szólnak? Mi a véleményed?

Bert Scalzo: Van egy véleményem, és ez - tudod, ismét azt fogom mondani, hogy ez a véleményem - például a Microsoft a Ballmer utáni időszakban csak benyomást kelti bennem az élő pokolból. Arra gondolok, hogy ez a szakaszos adatbázis megszerezze az SQL Server-et Linuxon, a .NET-et Linuxon, a PowerShell-et Linuxon; Nem hiszem, hogy a hagyományos adatbázis-gyártók el fognak maradni. Azt hiszem, úgy döntöttek: „Hé, hagyja, hogy az új srácok, az induló vállalkozók meghatározzanak valamit. Hadd mutassák meg, mi a sharding, és hogyan kell azt tökéletesíteni, és miután elvégezték az összes kutatást és fejlesztést, pontosan tudjuk, mit akarnak a felhasználók, most tegyük hozzá az sharding-ot az Oracle-hez. ”Azt hiszem, ők csak okosak és mondván: "Hé, a második vagy a harmadik nem rossz, ha az uralkodó játékos vagy, mert akkor az emberek nem vándorolnak el tőled."

Robin Bloor: Igen, úgy értem, hogy ez egy alkalmazott stratégia. Arra gondolok, hogy az IBM ezt szokta, és az egészet - a teljes termékskálájukra - és ez meglehetősen jól értékelhető, amíg valaki fel nem jön valami olyasmival, ami éppen a falon kívül van, amire senki sem gondolt volna, de nem tud megtervezni ezzel szemben.

Kérdések a közönség részéről, Eric?

Eric Kavanagh: Igen, de van időd, azt hiszem, csak egyre gondolok, és tudom, hogy Bertnek el kell futnia. Volt itt valami - oké, az Oracle 12c árnyékoló architektúrája ezt jelzi - vagy mit jelentenek véleménye szerint, mit gondol, mi történik ott?

Bert Scalzo: Nos, az Oracle mindent felszív és / és felkínál, amit az összes többi adatbázis gyártó kínál. Például strukturálatlan adatokat tehetek az Oracle-be. Nem tudom, hogyan lehet a strukturálatlan adatokat feltenni, majd relációs adatbázisnak hívni, tehát nincs értelme, de megteheti. És most az Oracle hozzáteszi a shardingot, tehát az Oracle azt mondja: „Tudod mit? Bármit is akar a piac, az adatbázis-ajánlatot tesszük, mert a piac azt akarja, amit a piac akar, és mi megoldást akarunk szállítani, azt akarjuk, hogy velünk maradjanak. ”

Azt hiszem, további elemeket fog látni. Nem lennék meglepve, ha az adatbázis-csomópontok Hadoop-szerű csoportosulását nem Oracle rack-ben vagy valódi alkalmazásfürtben látnám, hanem alapvetően egy hagyományos Hadoop-típusú klaszterben, amely ezt az árnyékolást végzi. És úgy gondolom, hogy olyan adatbázist is telepíthet, mint az Oracle, mint ahogyan egy Hadoop lenne, és ezek a tendenciák folytatódni fognak. Ezek a nagy adatbázis-gyártók milliárd dollárt keresnek, és nem akarják elveszíteni piacát, ezért hajlandóak bármihez alkalmazkodni, vagy bármit elfogadni.

Eric Kavanagh: Nos, tudod, vicces, mert jó ideje követtem a nyílt forráskódú gyártókat, és azon gondolkodtam, hogy mindez milyen nagy hatással lesz a hagyományos zárt ajtók technológiájára, és egy ideig biztosan úgy éreztem, hogy a nyílt forráskódú gyártók komoly haladást hajtanak végre, és most, amikor a piacra nézek, látom, amit mondasz: a nagy fiúk megtették matematikájukat, élesebbé tették ceruzaikat, és kitalálták, hogyan sokat szövhetnek ezekből a dolgokból építészetükbe. Legyen szó az IBM-ről, az Oracle-ről vagy az SAP-ról - én csak a múlt hónapban voltam a SapphireNow konferencián, és Steve Lucas, aki a cég felét vezette, azt hitte, hogy az SAP a HANA felhőplatformjában sokkal több nyílt forrású komponenst tartalmaz, mint bármelyikük versenytársai. Ha ezt megcsinálod, ez egy nagyon lenyűgöző nyilatkozat, és azt mondja nekem, hogy a nagy fiúk nem mennek sehova hamarosan.

Bert Scalzo: Nem, mindkettőre fogadnék a pénzem. Úgy értem, ha megnézed, a Microsoft részvényei a közelmúltban körülbelül 50 dollár körül voltak, és tudod, csak néhány évvel ezelőtt ez 25 volt. Rövid időtartam alatt nem kétszeresére növeli részvényárfolyamát, csak ha jó dolgokat csinálsz, és Tudom, hogy a Windows 10 első évi ingyenes használatától kezdve az összes többi okos dologig, amit csinálnak, ez a szakaszos adatbázis-szolgáltatás szerintem csak fenomenális. Azt hiszem, hogy mi fog történni, sok ember az Azure-ba fog végül kerülni, nem közvetlenül, nem úgy, mint mondták: „Áttelepítjük az adatbázisomat az Azure-ba”. oda-vissza az új szakaszos adatbázis-szolgáltatás használatával, és így az Azure elfogadása csak gyors növekedést mutat.

Eric Kavanagh: Nos, ez a piacon az egyik tendencia, amelyet még a Mac-én is látok. Ahogyan a Mac-en menti néhány dokumentum mentését, most már - és az újabb Mac-ek csak a felhőn követik, ugye? Úgy értem, ebben a stratégiában nagyon sok értelme van, és azt is megnézem, és megyek: „Oké, srácok, darabokra próbálsz rácsalogatni a felhőkörnyezetedbe, majd egy nap, amikor filmet akarok nézni, ha hitelkártyám lejárt, bajban leszek. ”

Bert Scalzo: Igen, de a Facebookon csinálod.

Eric Kavanagh: Igen. Ez igaz.

Bert Scalzo: Mindent feltesz a Facebook-ra.

Eric Kavanagh: Nos, nem egészen.

Bert Scalzo: Nem, úgy értem …

Eric Kavanagh: Igen, menj tovább.

Bert Scalzo: Ezek a társadalmi trendek az üzleti vállalkozásokban is megjelennek. Most a vállalkozásoknak még sok más dolguk van, amelyeket meg kell tenniük, de látják ezeket a trendeket, és ugyanazokat a dolgokat csinálják. Nem látom, hogy az Oracle vagy a Microsoft eltűnjön. Valójában mindkét esetben részvényeket fogok vásárolni, amikor bemerül.

Eric Kavanagh: Igen, valóban. Nos, nézd meg az idera.com oldalt, az IDERA dot com oldalt. Mint Bert mondta, egy csomó ingyenes cucc van odakint, és ez az egyik új trend a piacon - adj neked ingyen cuccokat, amelyekkel játszhat, kapaszkodhat, és akkor vásárolsz valódi cuccokat.

Emberek, ez egy újabb forró technológia. Köszönöm a mai idejét, Bert-nek, természetesen Dez-nek és Robin-nak is. A jövő héten beszélünk veled, emberek, rengeteg cucc folyik itt. Ha bármilyen ötlete van, nyugodtan e-mailt küldhet a saját e-mail címére. Legközelebb beszélgetünk veled, vigyázz. Viszlát.