Beszédfelismerés – magyarul
Beszédfelismerés - ha csak ezt a szót emeljük ki a fenti címből, már önmagában ez is több éves kutatások eredményeit és céljait foglalja magában. A világban számos próbálkozás történt már beszédfelismerésre, a működő megoldások azonban leginkább angol nyelvre fókuszálnak.
A magyar nyelv nyelvtana meglehetősen egyedi, ezért ha csak a felismerésre koncentrálunk, már akkor is igen sokrétű és komplex problémahalmazzal kell foglalkoznunk.
A Montana egy olyan megoldást készül megvalósítani, mely teljes mértékben a magyar nyelv sajátosságaira fókuszál! Helyes szavak, szótövek, ragok, jelek, toldalékok felismerésével, majd mondatok építésével.
A fentiek teljesülése már önmagában sem kis feladat, azonban ha ezt valós időben is fel lehet dolgozni, akkor annak kimenetéből igen hasznos segédeszközök építhetők. A hangfelvételekből automatikusan készülő leiratokban lehetőség nyílik a minőségi keresésre. A keresések több módon is megvalósíthatók:
- Valós idejű ún. real time keresés - ebben az esetben az automatikusan készülő leiratban a lejegyzéssel párhuzamosan valós időben végezzük a keresést → a keresés eredményeit akár meg is jeleníthetjük, vagy a keresés eredményeiből újabb következtetések levonásával, más rendszerekből kérhetünk le számunkra fontos információkat
- Utólagos háttérkutatás - ekkor az automatikusan lejegyzett hanganyagok teljes adatbázisban végzünk szövegbányászatot, melyekből a lehető legegyszerűbb lekérdezéstől a nagy komplexitású statisztikáig mindenféle adatok kinyerhetők. Például egy ügyfélszolgálat több heti lejegyzett anyagaiból kiszűrhető, hogy a 20-25 éves felhasználóknak ilyen, a 26-40 éves felhasználóknak pedig olyan jellegű állandó problémájuk van egy bizonyos szolgáltatással, termékkel, stb.
Az elkészülő pilot megoldás általános célú felismerésre lesz képes, ahhoz hogy egy szakmához jól illeszkedjen a konkrét felhasználói területhez teste kell szabni. Ehhez természetesen tanítani kell a felismerő motort, melynek módja az adott környezetből kinyerhető szöveges adatok lejegyzésén alapul. Minél több és minél pontosabb ilyen anyaggal rendelkezünk, annál jobb kimenetet kaphatunk felismerési eredményül. (axel, rövidítve)