Itthon Trends Mi a jobb, ha egy platform vagy egy saját maguknak a gépi tanulási algoritmusa van a dolgozók számára?

Mi a jobb, ha egy platform vagy egy saját maguknak a gépi tanulási algoritmusa van a dolgozók számára?

Anonim

K:

Mi jobb, ha egy platform vagy egy saját magának gépi tanulási algoritmusa van az AWS-en?

A:

Manapság sok vállalat integrálja a gépi tanulási megoldásokat elemző eszközkészletébe, hogy javítsa a márkamenedzsmentet, javítsa az ügyfelek tapasztalatait és növelje az operatív hatékonyságot. A gépi tanulási modellek képezik a gépi tanulási megoldások alapvető alkotóelemeit. A modelleket matematikai algoritmusok és nagy adatkészletek felhasználásával képezték ki a megbízható előrejelzések készítéséhez. Az előrejelzések két általános példája (1) annak meghatározása, hogy a pénzügyi tranzakciók halmaza csalást jelez-e, vagy (2) a közösségi médiából gyűjtött adatok alapján a termék körüli fogyasztói hangulat értékelése.

Az Amazon SageMaker egy teljesen kezelt szolgáltatás, amely lehetővé teszi a fejlesztőknek és az adattudósoknak gépi tanulási modellek felépítését, kiképzését és telepítését. A SageMakerben használhatja a dobozból kivont algoritmusokat, vagy elérheti a saját magad útját egy testreszabottabb megoldáshoz. Mindkét választás érvényes, és egyaránt szolgál a sikeres gépi tanulási megoldás alapjául.

(A szerkesztő megjegyzés: A SageMaker más alternatíváit itt láthatja.)

A SageMaker beépített algoritmusai népszerű, rendkívül optimalizált példákat tartalmaznak a kép osztályozására, a természetes nyelv feldolgozására stb. A teljes lista itt található .

  • A dobozon kívüli előnyei: Ezek az algoritmusok előzetesen vannak optimalizálva (és folyamatos fejlesztésen mennek keresztül). Gyorsan fel lehet készülni, futni és telepíteni. Ezen felül elérhető az AWS automatikus hiperparaméter-hangolás.
  • A dobozon kívüli megfontolások: A fent említett folyamatos fejlesztések előfordulhat, hogy a kiszámíthatatlanul nem eredményeznek eredményt, mintha az algoritmusok végrehajtása felett teljes ellenőrzést gyakorolna.

Ha ezek az algoritmusok nem felelnek meg a projektnek, akkor három másik választási lehetősége van: (1) az Amazon Apache Spark Library, (2) egyéni Python-kód (amely a TensorFLow vagy Apache MXNet-et használja), vagy (3) „hozza meg a sajátját” oda, ahol alapvetően nem korlátozottak, de létre kell hoznia egy Docker képet a modell kiképzéséhez és kiszolgálásához (ezt megteheti az itt található utasítások alapján).

A saját magad által nyújtott megközelítés teljes szabadságot kínál Önnek. Ez vonzónak bizonyulhat azon adattudósok számára, akik már létrehoztak egy olyan egyedi és / vagy szabadalmaztatott algoritmikus kód könyvtárat, amely nem feltétlenül képviselteti magát a jelenlegi dobozkészletben.

  • Saját előnyök: Teljes ellenőrzést tesz lehetővé a teljes adattudományi folyamat felett a védett IP használatával.
  • Vegye figyelembe a saját szempontait: A kapott modell képzéséhez és kiszolgálásához dokkerizálás szükséges. Az algoritmikus fejlesztések beépítése a te felelősséged.

Függetlenül attól, hogy milyen algoritmust választott, a SageMaker on AWS egy megfontolásra érdemes megközelítés, mivel az adattudomány szempontjából mekkora figyelmet fordítottak a könnyű felhasználásra. Ha valaha is megpróbált egy gépi tanulási projektet migrálni a helyi környezetből egy házigazdára, akkor kellemesen lepni fogod, hogy a SageMaker zökkenőmentesen megvalósítja. És ha a semmiből indul, akkor már néhány lépéssel közelebb van a célhoz, figyelembe véve, hogy mekkora összeg van már kéznél.

Mi a jobb, ha egy platform vagy egy saját maguknak a gépi tanulási algoritmusa van a dolgozók számára?