Tartalomjegyzék:
Meghatározás - Mit jelent a nem címkézett adat?
A nem címkézett adatok olyan adatdarabok megnevezése, amelyeket nem címkéztek meg a jellemzőket, tulajdonságokat vagy osztályozást azonosító címkékkel. A nem címkézett adatokat általában a gépi tanulás különféle formáiban használják.
A Techopedia magyarázza a nem címkézett adatokat
A felügyelet nélküli gépi tanulásnak nevezett gépi tanulás típusaiban a gépi tanulási program a fel nem jelölt adatok halmazának kiértékelésével működik. Mivel az adatoknak nincs címkéjük, a gépi tanulási programnak meg kell határoznia az egyes adatelemeket azok tulajdonságain és jellemzőin.
Az egyik legjobb módszer ennek megmagyarázására a gyümölcstál metaforája. Tegyük fel, hogy a gépi tanulási program három különféle gyümölcs - banán, szőlő és alma - azonosítását tanulja. Ha a kezdeti képzési készletben szereplő adatok címkével vannak ellátva, akkor a gépi tanulási program ebből a szempontból működik - az egymást követő képeket illeszti e három kategória egyikéhez.
Ha azonban az adatdarabok egyikét sem jelöli a három gyümölcsnév - banán, szőlő és alma -, a gépi tanulási programnak működnie kell az egyes képek értékelésével, és olyan jellemzők megvizsgálásával, mint a szín - sárga, piros vagy lila - alakzatok - hosszú és vékony, kerek vagy csoportosítva - és egyéb jellemzők.
Ebből a példából könnyen belátható, hogy a címkézett adatok sokkal könnyebben lehetővé teszik a gépi tanulási algoritmusok felhasználását a döntési eredményekhez. A címkézetlen adatokkal foglalkozó kifinomult, felügyelet nélküli gépi tanulási programok meglepően pontos és pontos eredményeket is eredményezhetnek.
