Itthon Szoftver Hangfelismerő technológia: hasznos vagy fájdalmas?

Hangfelismerő technológia: hasznos vagy fájdalmas?

Tartalomjegyzék:

Anonim

Hívtál már valaha egy társaságot segítségért vagy a számla kifizetéséhez, csak hogy egy kellemes rögzített hang fogadja, aki beszélgetni akar veled, de nem tudja megérteni, amit mond? Vagy talán a saját iPhone-ja van, és bár Siri először jó szövetségesnek tűnt, rájöttél, hogy néha (rendben, legyünk őszinték, gyakran) csak nem kapja meg? A hangfelismerő technológia (VRT), más néven a beszéd-szöveg szövege, általános csapdába esik: valószínűleg hihetetlenül hűvös (és fiú, mi gyökerezzük rá), de gyakrabban ez egy fogcsiszolás gyakorolni frusztrációt.


Egyszerûen a tudományos fantasztikus világ körébe tartozó ötlet, a hangfelismerés az 1950-es évek elején kezdõdik, amikor a Bell Laboratories Audrey rendszert úgy tervezték, hogy felismerje az egyetlen hangon beszélt számjegyeket, a modern beszélgetõ elektronika hálózatához, amellyel most kapcsolatba lépünk. naponta - vegyes eredményekkel.

Ha beszélni szeretne egy emberrel, kérjük, nyomja meg a 0 gombot

A mai vállalkozások nagy része ma az interaktív hangos válasz (IVR) rendszerrel kezeli az ügyfélszolgálati hívásokat. A leggyakoribb a hanggal navigált menük használata, de egyes vállalatok IVR rendszereket használnak, amelyek hozzáférhetnek az ügyfélszámlához és válaszolnak kisebb kérdésekre. A Menü IVR szoftvernek általában korlátozott szókincse van, amely korlátozható "igen", "nem" és számokra. A bonyolultabb rendszerek felismerik a vállalat-specifikus szavakat és kifejezéseket.


Ezek a rendszerek egyre népszerűbbé válnak - legalábbis a vállalkozások számára - költséghatékonyak. A Wall Street Journal 2010. évi jelentése szerint egy tipikus ügyfélhívás, amely megkapja az ügynököt, 3 és 9 dollár között mozog, míg az automatizált rendszeren keresztül kezelt hívás csak öt-hét centet fizet. És természetesen a számítógépes programok nem fáradnak el, betegnek hívnak, és nem csalódnak az ügyfelekkel (bár az ügyfelek minden bizonnyal csalódnak velük!).


Szerencsére ez nem mindig azt jelenti, hogy az IVR elvonja a munkahelyeket az emberektől - vagy legalábbis azt, hogy minden ember eltűnik a telefonos ügyfélközpontokból. Ezek a hanggal aktiválható segítők lehetővé teszik az emberi ügyfélszolgálat képviselőinek hatékonyabb működését hívások irányításával és egyszerű kérdések megválaszolásával.


Természetesen az emberi felhasználók számára, akik ezekkel a technológiákkal működnek együtt, ez nem mindig sima vitorlázás. A technológia elősegíti az IVR technológiában felmerülő általános problémák, például az ékezetes problémák megoldását, ám az automatizált rendszerek kicsomagolása továbbra is gyakori téma az interneten. Nézze meg ezt a vígjátékot egy hangfelismeréssel felszerelt lifttel kapcsolatban, amely kiemeli a frusztrációt, amelyet az IVR rendszerek hibás működése okozhat.

Személyes telefonos alkalmazások: Siri, Google Now

A legtöbb ember ismeri az okostelefonok hangfelismerését. Miközben a legújabb telefonmodellek nagy része a VR-vel érkezik, népszerűsége és hírhedtsége megduzzadt, amikor az Apple 2011-ben bemutatta a Siri-t, az iPhone 4S enyhén szarkasztikus, hanggal aktiválható „személyes asszisztense”. A Google hamarosan közvetlen versenytársat hozott létre: a Google Most az Android Jelly Bean operációs rendszerre. Mindkét rendszer női hangokkal és kifinomult felismerési funkciókkal rendelkezik, amelyek lehetővé teszik a felhasználók számára, hogy alkalmi nyelven "beszéljen" a telefonjukkal.


De bár ezek a rendszerek sokkal kifinomultabb és funkcionálisabbak, mint elődeik, megmutatják, hogy a technológiának még hosszú utat kell megtenni. A Siri kudarcáról szóló viccek népszerű internetes mémévé váltak. Egy ember még az Apple-t is beperelte a Siri képességeivel kapcsolatos hamis reklámért.


Talán ezért van az, hogy míg az Apple a Siri fejlett és informatív fejlesztésével hozta létre, a VR szoftver szintén kissé pimaszos oldalon van. Például, ha a mozitörténet egyik leghírhedtebb intelligencia-technológiai vonalát mondja az 1968-as "2001: A Space Odyssey" című filmből - "nyissa ki a pod öböl ajtajait" - Siri vagy a film válaszadó vonalával reagál " Sajnálom (neved), attól tartok, hogy nem tudom ezt megtenni, "vagy annál szarkasztikusabb, " mi hírszerző ügynökök nyilvánvalóan soha nem élünk le. "


A név szerinti hívás csak egyike azon funkcióknak, amelyek megkönnyítik a Siri szeretését és egy kicsit emberiesbbé válását. A VR asszisztens hangutasításokkal követheti a hívásokat, diktálhat és szövegeket küldhet, információkat kereshet interneten, kereshet közeli üzletekben, adhat vezetési útmutatásokat és így tovább, anélkül, hogy bármit meg kellene érintnie. A válaszokat egyszerre a telefon mondja ki, és megjelenik a képernyőn.


A Google Now, az Android Jelly Bean platform VR része nagyon hasonlít a Siri-hez. A rendszer ugyanazokat a széles körű felismerési képességeket kínálja, amikor az alkalmi beszédeket olyan parancsokká fordítja, amelyek lehetővé teszik a felhasználók számára, hogy hívásokat kezdeményezzenek, szövegeket küldjenek, kereséseket végezzenek, számításokat és konverziókat készítsenek, megragadja a szódefiníciókat, állítson be riasztásokat, játsszon dalokat, és térképeket és útmutatásokat kapjon.


Személyes hangsegédjeivel, mint például a Siri és a Google Now, az előnyök nyilvánvalóak. A hívástól és a sms-től a kereséstől és a szórakoztatástól kezdve minden gyorsabb és könnyebb. Csak mondja el, amit akar, és (általában) a VR alkalmazás megragadja az Ön számára. A VR ki- és bekapcsolási technológiája vezetés közben különösen hasznos. És bár sokan elítélték Siri hibáit, és az írók azt állították, hogy a Google Now azon képessége, hogy alapvetően a felhasználók életét irányítsa, kissé kísérteties, kissé sértő, a legtöbb ember szerint ezek a futurisztikus technológiák elég hűvösek.


Természetesen a személyes telefonos alkalmazások, például a Siri és a Google Now, messze nem tökéletesek - bár megmutatják, hogy a jövőben milyen irányba vezetheti ezt a technológiát. Ez azt jelenti, hogy még akkor is, ha Siri rossz választ ad, valószínűleg nevetünk és megbocsátunk neki, tudva, hogy a következő verzió sokkal jobb lesz.

Ahol a VR esik

Ha valaha is találkozott egy IVR-vel, amikor egy vállalkozást hívott, akkor valószínűleg észrevette a kommunikáció bizonyos akadályait. Egyes programok robotok által használt szöveg-beszéd hangot használnak, amely helytelenül állítja a szavakat, és megnehezíti a dolgok megértését. Mások érzékenységi problémákkal járnak, amelyek miatt a szoftver nem képes feldolgozni azt, amit mond, ha túl hangos, túl lágy vagy nem szórakoztatóan szórakozik.


Ezenkívül sok ember még mindig nem érzi magát kényelmesen egy gépen beszélgetni. Ha néhány keresést hajt végre az IVR-n, akkor találkozók lesznek, amelyekben az emberek összeállították az IVR-rendszerek megkerülésének és egy "valódi embernek" elérésének módjait. Ez a megoldás a "folyamatosan nyomja meg a 0-ot az operátor számára" és "esküszjön a gépre mindaddig, amíg az ember nem fog kinyúlni". Ennek eredményeként az IVR rendszerekben a közelmúltban kifejlesztett események nagy része annak köszönhető, hogy az emberek számára ízletesebbé váljanak; a hangok szimpatikusabbá és kevésbé robotikussá teszik, megkönnyítik a rendszer navigálását, és tudatják a hívókat, hogy mennyi ideig tart az egész az elejétől a végéig. Ez azt sugallja, hogy a jobb technológia itt csak a harc fele; a másik fél arra készteti a felhasználókat, hogy beszéljenek egy gépen.

Mit tartogat a jövő

E kihívások ellenére a hangfelismerő technológia folyamatosan fejlődik. Az olyan alkalmazások, mint a Siri és a Google Now - a hibák és az összes - továbbra is rendkívül lenyűgöző teljesítményű, és számos vállalat kibővíti a VR képességeit más alkalmazásokra.


Például a Nuance, a Dragon NaturallySpeaking beszéd-szöveges szoftver alkotói, már kifejlesztették a hangvezérlőket a televíziókhoz és az autókhoz, és ennek a technológiának a verziói beépültek néhány Samsung televízióba és a SYNC szórakoztató rendszerekbe, amelyeket bizonyos Ford járművekben használnak.


És mivel a Google és az Apple továbbra is új felhasználási lehetőségeket talál a hangfelismerő technológiáikhoz, valószínű, hogy egyre inkább mindennapi gépekkel beszélünk, a televízióktól a kenyérpirítóinkig. És ismét úgy tűnik, hogy a tudományos fantasztikusnak igaza volt. Csak remélnünk kell, hogy az okos írók tévedtek egy dologban. Ha ezeket a gépeket átveszik, akkor sok bajban lehet, amikor legközelebb megkérdezi Siri-t, hogy "nyissa ki a hüvelyek ajtaját".

Hangfelismerő technológia: hasznos vagy fájdalmas?