Itthon Hang Miért lehet, hogy néhány gépi tanulási projekt hatalmas számú szereplőt igényel?

Miért lehet, hogy néhány gépi tanulási projekt hatalmas számú szereplőt igényel?

Anonim

K:

Miért lehet, hogy néhány gépi tanulási projekt hatalmas számú szereplőt igényel?

A:

Amikor a gépi tanulásra gondol, hajlamos arra, hogy képzett adattudósokra gondoljon, akik számítógépes helyiségek billentyűzetein dolgoznak. Nagyon nagy hangsúlyt fektet a mennyiségi elemzésre és az algoritmusokra. Ezeknek a programoknak nem sok a közvetlen valós kontextusában van - legalábbis erre gondolnának sokan.

A mai napig legfrissebb gépi tanulási programok azonban az emberi szereplők valódi seregeit használják ki az utcán, üzletekben és bárhol másutt, hogy modellezzék az alapvető emberi tevékenységeket, mint például a séta, a munka vagy a vásárlás.

Ingyenes letöltés: Gépi tanulás és miért számít?

Tom Simonite vezetékes cikke ezt jól szemlélteti a megfelelő címmel: „Az AI okosabbá tétele érdekében az emberek teljesítik az Oddball alacsony fizetésű feladatokat”.

A Whole Foods élelmiszerboltban készített rövid videók példáján a Simonite kiemeli azokat a munkákat, amelyek elősegítik a gépi tanulás következő szakaszának felépítését.

Ez felveti a kérdést, hogy ezek az emberek miért vesznek magukat filmbe egy rövid és egyszerű videóban, amelyek olyan kezdetlegesen dokumentálják a tevékenységeket, mint a kar vagy a láb mozgatása.

A válasz rávilágít arra, hogy hol van a gépi tanulás, és hol megy.

„A kutatók és a vállalkozók szeretnék látni, hogy az AI megérti és cselekszik a fizikai világban” - írja a Simonite, elmagyarázva, hogy miért mások és kamerák mozognak. „Ezért a munkavállalóknak szükségük van arra, hogy jeleneteket készítsenek a szupermarketekben és otthonokban. Gondos anyagot állítanak elő, amely algoritmusokat tanít a világról és az abban élő emberekről. ”

Amint sok szakértő rámutat, a gépi tanulás egyik legnagyobb határa a képfeldolgozás és a természetes nyelvfeldolgozás. Ezek rendkívül kvantitatív eljárások - más szavakkal, nincs olyan bemeneti spektrum, mint amilyen a "végrehajtó" valós környezetben van. Ehelyett a gépi tanulási programok nagyon konkrét módon használnak vizuális és audio adatokat modellek készítéséhez. A képfeldolgozás révén a (véges) látótérből kiválasztja a szolgáltatásokat. Az NLP számára a fonémák összeállítása.

Ezen specifikus bemeneti kategóriák túllépése magában foglalja az úgynevezett „kép- és beszédrés” fogalmát - ha túlmutat a képfeldolgozáson és a beszédfelismerésen, olyan területeken mozog, ahol a számítógépeknek különféle módszerekkel kell elemzniük. Az edzéskészletek alapvetően különböznek egymástól.

Lépjen be a videóírók seregébe. Ezen új gépi tanulási projektek közül az emberi tevékenységek legkisebb ötlete a képzési készletek. Ahelyett, hogy az osztályozási feladatokba beillesztett tulajdonságok, élek és képpontok keresésére lett volna képezve, a számítógépek ehelyett képzési videókat használnak annak felmérésére, hogy a különféle műveletek hogyan néznek ki.

A legfontosabb dolog az, mit tehetnek a mérnökök ezekkel az adatokkal, amikor azokat összesítik és betöltik, és amikor a számítógépet képzik rajta. Hamarosan látni fogja az eredményeket a különféle területeken - például ez rendkívül hatékonnyá teszi a felügyeletet. A számítógépek képesek lesznek "látni" a látótérben azt, amit az emberek csinálnak, és alkalmazni ezt olyan területeken, mint például a marketing és az értékesítés, esetleg bizonyos esetekben a kormányhivatalok munkája vagy a büntető igazságszolgáltatás.

A következmények rávilágítanak a vita és a magánélettel kapcsolatos kérdések közötti vitára is. Ezeknek a videóknak a felhasználása nagy részben gépi tanulási modelleket épít fel, amelyek megfigyelés céljából működnek - de mi lenne azokkal az emberekkel, akik nem akarnak felmérést végezni? Mire vonatkoznak az egyén jogai, és ha ezen új gépi tanulási programokat a nyilvános térben alkalmazzák?

Mindenesetre a cégek ilyen típusú emberi és videó erőforrásokat használnak annak érdekében, hogy valóban belemerüljenek a gépi tanulás haladásának néhány szintű szakaszába, amelyek valóban lehetővé teszik a számítógépek számára, hogy felismerjék a körülöttük zajló eseményeket, ahelyett, hogy osztályoznák a képeket vagy dolgoznának a beszéd. Ez egy rendkívül érdekes és ellentmondásos fejlemény a mesterséges intelligencia területén, és megérdemli a figyelmet a tech médiában és azon kívül is.

Miért lehet, hogy néhány gépi tanulási projekt hatalmas számú szereplőt igényel?