Itthon Szoftver Mi a beszédszintézis? - meghatározás a techopedia alapján

Mi a beszédszintézis? - meghatározás a techopedia alapján

Tartalomjegyzék:

Anonim

Meghatározás - Mit jelent a beszédszintézis?

A beszédszintézis az emberi beszéd mesterséges szimulálása számítógép vagy más eszköz segítségével. A hangfelismerés és a beszédszintézis ellentétben leginkább a szöveges információk audioinformációkká történő fordításához és olyan alkalmazásokhoz használják, mint például a hangkompatibilis szolgáltatások és a mobil alkalmazások. Ezen kívül a segítő technológiában is használják a látássérült egyéneknek a szöveges tartalom olvasásában történő segítésére.

A Techopedia magyarázza a Beszédszintézist

Az első teljesen működőképes hangszintetizátornak Homer Dudley VODER-jét, amely a Bell Laboratories hangszerkészítőjén alapszik. A beszédszintézishez használt számítógépet beszédszintetizátornak vagy beszédszámítógépnek nevezzük. A beszédgép minőségét gyakran az emberi hanghoz való hasonlóság alapján ítélik meg. A legtöbb számítógépes operációs rendszer az 1990-es évek eleje óta beszédszintetizátorokat épített be. A szintetizált beszédet általában a rögzített beszéd összefűzött darabjai segítségével állítják elő, amelyeket egy adatbázis tartalmaz.

A beszédszintézis kezdeti stádiuma az előfeldolgozás, amely kiküszöböli a homográfok kezelését is magában foglaló kétértelműséget az adott szó olvasásának módja körül. A beszédszintézis következő szakaszában a számítógép a fonémák segítségével konvertálja a szöveget hangok sorozatává. Az utolsó szakaszban emberi felvételeket vagy alapvető hanggenerációs technikákat alkalmazunk az emberi hangmechanizmus utánozására és a teljes szöveg elolvasására. A beszédszintézis egyik népszerű ága az audiovizuális beszédszintézis vagy multimodális beszédszintézis, amely szorosan szinkronizált animált arcot használ a szintetizált beszéd kiegészítésére. A multimodális beszédszintézis további funkciókat is tartalmaz, például nem verbális útmutatásokat a beszédhez, hogy segítse a felhasználó szavainak pontosabb kommunikációját. Számos beszédszintetizáló rendszer lehetővé teszi a felhasználók számára a hang típusának kiválasztását, például a férfi vagy női hangot.

A legtöbb beszédszintetizáló rendszer képes szövegek olvasására és nagyon intelligens módon történő kiadására, bár a hang néha tompa lehet. A beszédszintézisnek azonban még ki kell fejlesztenie az emberi intonációk és kadenciák széles spektrumának teljes utánozására való képességet.

Mi a beszédszintézis? - meghatározás a techopedia alapján