Itthon Fejlesztés Miért jelent problémát a gépi torzítás a gépi tanulásban?

Miért jelent problémát a gépi torzítás a gépi tanulásban?

Anonim

K:

Miért jelent problémát a gépi torzítás a gépi tanulásban?

A:

Erre a kérdésre kétféle módon lehet válaszolni. Először: miért jelent problémát a gépi torzítás, mint az, miért létezik a gépi tanulási folyamatokban?

A gépi tanulás, bár kifinomult és összetett, bizonyos mértékben korlátozott az általa használt adatkészletek alapján. Az adatkészletek felépítése velejáró torzításokkal jár. Csakúgy, mint a médiában, ahol a mulasztások és a beillesztés szándékos választása bizonyos elfogultságot mutathat, a gépi tanulás során a felhasznált adatkészleteket is meg kell vizsgálni annak meghatározására, hogy milyen torzítás létezik.

Ingyenes letöltés: Gépi tanulás és miért számít?

Például, a technológiai tesztelés és a tervezési folyamatok esetében gyakori probléma az, hogy az egyik típusú felhasználó előnyben részesíti a másikot. Egy nagy példa a nemek közötti különbség a tech világban.

Miért változtat ez, és miért vonatkozik a gépi tanulásra?

Mivel a meglévő nők hiánya a vizsgálati környezetben előállíthat egy olyan technológiát, amely kevésbé felhasználóbarát a női közönség számára. Egyes szakértők ezt írják le úgy, hogy a meglévő női tesztelés nélkül a végtermék nem ismeri fel a női felhasználók hozzájárulását - előfordulhat, hogy nem rendelkeznek eszközök a női identitások felismeréséhez vagy a nők hozzájárulásának megfelelő kezeléséhez.

Ugyanez vonatkozik a különféle etnikai hovatartozásokra, különböző vallású emberekre vagy bármilyen más demográfiai csoportra. A megfelelő adatok nélkül a gépi tanulási algoritmusok nem fognak megfelelően működni egy adott felhasználói halmaznál, tehát a felvételi adatokat szándékosan kell hozzáadni a technológiához. Ahelyett, hogy csak az elsődleges adatkészleteket vennék és erősítenék a bennük rejlő elfogultságot, az emberkezelőknek valóban meg kell vizsgálniuk a kérdést.

Egy másik példa a gépi tanulási motor, amely befogadja a munkával és a fizetéssel kapcsolatos információkat, és kiszámítja az eredményeket. Ha az eleven adatkészletet nem elemezik, a gép megerősíti az előítéletet. Ha úgy látja, hogy a férfiak a vezetői munka túlnyomó többségét viselik, és a gépi tanulási folyamat magában foglalja a nyers adatkészlet kiszűrését és a megfelelő eredmények visszaadását, akkor olyan eredményeket fog adni, amelyek férfi elfogultságot mutatnak.

A kérdés második részében felmerül a kérdés, hogy miért olyan káros az elfogultság. Megfelelő felügyelet és tesztelés nélkül az új technológiák károsíthatják, nem segíthetik a befogadás és az egyenlőség érzetét. Ha olyan új technológiai terméket hoznak forgalomba, amely felismeri a világosabb bőrű, de nem sötétebb bőrű arcokat, ez fokozhatja az etnikai feszültségeket és azt az érzést, hogy a kérdéses vállalat nem érzékeny a sokféleségre. Ha egy gépi tanulási algoritmus reprodukálja és tovább fokozza az adathalmaz torzítását, akkor a mesterséges intelligencia hozzá fogja adni a hangját az emberi hangokhoz és emberi tendenciákhoz, amelyek a szociális rendszerben már léteznek, és amelyek előnyben részesítik az egyik embercsoportot a másikkal szemben.

A legjobb módszer ennek kezelésére az, ha alaposan megvizsgálja a mögöttes adatkészleteket, használja a szolgáltatásválasztást, ad be változó bemeneteket és maguk manipulálják a nyers adatkészleteket, és az adatok szándékos emberi kidolgozásával növeli a gépi tanulás valódi erejét, hogy az eredmény nagy analitikai erővel bír, ugyanakkor azoknak az emberi betekintéseknek a nézeteit is, amelyeket a számítógépek még nem tudnak lemásolni.

Miért jelent problémát a gépi torzítás a gépi tanulásban?