Miért tökéletes a hadoop a genom szekvenáláshoz?

2026

Tartalomjegyzék:

A genomika jelenje és jövője
A genomtérképező ipar igényei

A klinikai genomika izgalmas téma, ahol az emberek csúcstechnológiákon dolgoznak a gyors és pontos eredmények feldolgozása érdekében. A piacon rengeteg genomszekvencia áll rendelkezésre, amelyek szekvenciaadatok petatabátjait állítják elő, és a szekvenálás növekedése a közeljövőben az adatok exabitáinak előállításához vezet. A Hadoop itt tökéletes platform a komplex genomika munkafolyamatának feldolgozására. A Hadoop nagy mennyiségű információt tárolhat és rendezhet, és értelmes elemzést is nyújthat. (Ha képet szeretne kapni arról, hogy mekkora adatot jelent ez valóban, olvassa el a Bittek, bájtok és azok szorzóinak megértése című cikket.)

A genomika jelenje és jövője

Ma a genomtérképezés elérte a fejlődés csúcsát. Sok, a genomikai iparral foglalkozó ember elárasztja a kíváncsiságot, és mivel új lehetőségek mutatják be magukat, a jobb technológia az óra igénye. A genom szekvenálás nagyon ismétlődő és erőforrás-igényes feladat. Csak 2013-ban körülbelül 15 petaitta adatot állítottak elő, és csak 2000 szekvencia készítette. Ez az állkapocs-csökkenő mennyiség 300 KB szekvenált humán genom adatait tartalmazta. Az ilyen adattermelési sebességnél becslések szerint 2018-ra kb. Egy adat exabitát fog előállni. Ennek oka a szekvenciák növekedése, amely futásonként egyre több adatot fog előállítani. Egy másik ok a rendkívül nagy teljesítményű és olcsó genomszekvenáló gépek megjelenése. 2008 óta ezen gépek ára folyamatosan csökken. Ennek oka a nagy teljesítményű, új generációs gépek, amelyek bekerültek a piacra.

A genomtérképező ipar igényei

Az emberi genomból összegyűjtött adatok feldolgozásához komplex algoritmusokat használnak. Ezután ezeket az információkat tárolni kell. A jövőben felülvizsgálhatja az eredeti adatokkal való összehasonlítás érdekében. A 100 GB-os adatok feldolgozása és tárolása nem túl nehéz, főleg, ha a szekvenciaközpontokban alkalmazott erőteljes gépeken végzi. A tanulmányok azt mutatják, hogy ez az adatmennyiség csak körülbelül 1000 CPU óra alatt feldolgozható, tehát nagyon egyszerű. A technikai haladás üteménél nyilvánvaló, hogy a genomipar hamarosan néhány másodperc alatt több ezer gigabájtot dolgoz fel.

Miért tökéletes a hadoop a genom szekvenáláshoz?

Tartalomjegyzék:

A genomika jelenje és jövője

A genomtérképező ipar igényei

Közösségi bevétel: mi ez, miért működik és miért nem megy el?

Mi az a tökéletes határidős titoktartás (pfs)? - meghatározás a techopedia alapján

Mi a tökéletes kos? - meghatározás a techopedia alapján

Választható editor

Mi az azure szövetvezérlő? - meghatározás a techopedia alapján

Mi az azure szolgáltatási platform? - meghatározás a techopedia alapján

Mi az appscale? - meghatározás a techopedia alapján

Mi a cisco egységes számítási rendszer (cucs)? - meghatározás a techopedia alapján

Választható editor

Mi a periféria? - meghatározás a techopedia alapján

Mi a csővezeték? - meghatározás a techopedia alapján

Mi az a személyes rendszer / 2 (ps / 2)? - meghatározás a techopedia alapján

Mi a v.34? - meghatározás a techopedia alapján

Választható editor

Mi a belépés ellenőrzése? - meghatározás a techopedia alapján

Mi az a hozzáférési módszer? - meghatározás a techopedia alapján

Mi az a tanúsított információs rendszerek biztonsági szakember (cissp)? - meghatározás a techopedia alapján

Mi az acd vászon? - meghatározás a techopedia alapján

Választható editor

Mi a biztonsági szoftver? - meghatározás a techopedia alapján

Mi az a smiley? - meghatározás a techopedia alapján

Mi összeegyeztethető? - meghatározás a techopedia alapján

Mi az a bagbiter? - meghatározás a techopedia alapján

Választható editor

Mi az enum? - meghatározás a techopedia alapján

Mi fenyegeti a számítástechnikát? - meghatározás a techopedia alapján

Mi a biztonsági követelmények nyomonkövethetőségi mátrixa (srtm)? - meghatározás a techopedia alapján

Mi a bizalmi horgony? - meghatározás a techopedia alapján

Népszerű kategóriák