K:
Miért indítson gépi tanulást (ML) egy helyi számítógépen, majd rendszeres futtatást futtasson egy szerveren?
A:A gépi tanulási projekt és annak vonat- és tesztfázisának felépítésének kérdése sok kapcsolatban van azzal, hogy miként mozogunk az ML „életciklusán”, és miként vezetjük a programot az oktatási környezetből a termelési környezetbe.
A fenti modell használatának egyik legegyszerűbb oka az ML oktatás helyi gépen történő elhelyezése, majd a végrehajtás áthelyezése szerver alapú rendszerbe a feladatok elválasztásának alapvető előnye. Általában azt akarja, hogy az edzéskészlet elkülönüljön, hogy világos képet kapjon arról, hogy hol kezdődik és áll le az edzés, és hol kezdődik a tesztelés. Ez a KDNuggets cikk az alapelvet durva módon tárgyalja, miközben áttekinti néhány egyéb okot, hogy a helyi gépen elkülönítsék az edzőkészleteket. Ennek a modellnek az egyik alapvető érték-javaslata az, hogy a nagyon különböző architektúrákra épített képzési és tesztkészletekkel soha nem szabad zavarodni a vonat és a teszt közös elosztásában!
Egy másik érdekes előny a kiberbiztonsággal kapcsolatos. A szakértők rámutatnak, hogy ha a kezdeti vonatfolyamatok egy helyi gépen vannak, akkor azt nem kell csatlakoztatni az internethez! Ez alapvetően kibővíti a biztonságot, „inkubálja” a folyamatot, amíg el nem éri a termelési világot, ahol megfelelő biztonságot kell beépítenie a kiszolgáló modelljébe.
Ezen túlmenően ezen „izolált” modellek némelyike segíthet olyan problémákban, mint a koncepció elmozdulása és a rejtett kontextus - a „nem-állhatatosság” elve figyelmezteti a fejlesztőket, hogy az adatok az idő múlásával „nem maradnak ugyanazok” (attól függően, hogy mit mérnek) és hogy sok teszthez alkalmazkodni kell ahhoz, hogy a teszt fázis megfeleljen a vonat fázisának. Vagy bizonyos esetekben a vonat- és tesztfolyamatok összeolvadnak, és zavart okoznak.
A tesztfázis első alkalommal történő telepítése a szerveren elősegítheti a különféle „fekete doboz” modelleket, ahol megoldódik az adat adaptálhatóságának problémája. Bizonyos esetekben kiküszöböli a redundáns folyamatot, amikor a változási megbízásokat több platformon helyezik el.
Ezután a kiszolgálói környezet nyilvánvalóan azon valós idejű vagy dinamikus folyamatokat is szolgálja, amelyekben a mérnökök hozzáférni akarnak az ML-ben történő előállításhoz legjobban működő adatátviteli és kódmodellekhez. Például, az AWS Lambda vonzó lehetőség lehet a termelés mikrofunkcióinak kezelésére (vagy a Lambda és az S3 objektumtárolás kombinációjára) és kapcsolat nélkül (szerver nélkül), amely lehetetlenné válik.
Ez néhány olyan kérdés, amelyre a fejlesztők gondolkozhatnak, amikor meggondolják, hogyan lehet particionálni az ML szakaszokat a teszteléstől és a gyártástól kezdve.