K:
Miért fontos az adatátvitel néhány gépi tanulási projektben?
A:Az adatok megjegyzése fontos a gépi tanulásban, mivel sok esetben megkönnyíti a gépi tanulási program munkáját.
Ennek köze van a felügyelt és a felügyelet nélküli gépi tanulás közötti különbséghez. A felügyelt gépi tanulással a képzési adatok már fel vannak címkézve, hogy a gép jobban megértse a kívánt eredményeket. Például, ha a program célja a macskák azonosítása a képeken, akkor a rendszerben már sok fénykép van macskával vagy nem címkével ellátva. Ezután ezeket a példákat használja az új adatok összehasonlítására az eredmények létrehozása érdekében.
Ingyenes letöltés: Gépi tanulás és miért számít? |
A felügyelet nélküli gépi tanulással nincs címke, ezért a rendszernek attribútumokat és más technikákat kell használnia a macskák azonosításához. A mérnökök kiképzik a programot a macskák vizuális vonásainak felismerésére, mint például a bajusz vagy a farok, de ez a folyamat aligha van ilyen egyszerű, mint a felügyelt gépi tanulásban, ahol ezek a címkék nagyon fontos szerepet játszanak.
Az adatszolgáltatás címkéknek az edzési adatkészletekhez történő rögzítését jelenti. Ezeket sokféle módon lehet alkalmazni - fentebb már a bináris adat-annotációról beszéltünk - macskákról vagy nem macskákról -, de más típusú adatjegyzések is fontosak. Például az orvosi területen az adatszolgáltatás magában foglalhatja a specifikus biológiai képek címkézését a patológiát azonosító címkékkel vagy más orvosi tulajdonságok betegségmarkereit.
Az adatjegyzések elvégzése munkát igényel - és gyakran emberek csoportjai végzik -, de ez alapvető része annak, ami sok gépi tanulási projekt pontos működését teszi szükségessé. Ez biztosítja a program elsajátítását, amelyhez meg kell tanulnia, és hogyan kell megkülönböztetni a különféle bemeneteket, hogy pontos kimenetek jöjjenek létre.