régi, és csak a huszadik század technológiai
fejlődése formálta összefüggővé a mintavételezés, kvantálás,
frekvenciaanalízis, statisztika és predikció matematikai alapjait a
jelfeldolgozás, kódolás megfigyelt és értelmezett
reprezentáció(já?)val. Ez, a hetedik fejezet elkerülhetetlenül
megkövetel némi alapvető egyetemi matematikai ismeretet, de szerintem
nem többet, mint amit ma már nemcsak egy mérnöktől, de egy
közgazdásztól, társadalmi folyamatokat elemző szociológustól vagy a
korszerű képalkotó és egyéb diagnosztikai eszközöket felhasználó
orvostól is el lehet várni. Az egész fejezet mögött, a beszédanalízis
tükrében egy olyan reprezentációs szemlélet áll, amely a modern
gondolkodó értelmiségit áthatja a maga világának összefüggéseiben. A
modellezésnek itt is két szintje jelenik meg: az első a jelenség
leírása a fizika általánosító nyelvén és következő absztrakcióban, a
fizikusi elbeszélés matematikai fogalmazásában. Ennek a reprezentációs
folyamatnak a tudatos és kritikus követése az alapja mai haladásunk
gondolkodásmódjának.
Így közeledünk a beszédtechnika gyakorlatához. A
nyolcadik fejezet azokat az elméleti megfontolások alapján létrehozott
kísérleti adatbázisokat ismerteti, amelyek a gépi feldolgozás
összehasonlító alapjául szolgálnak, mintákat, amelyekre illeszteni
lehet a feldolgozandó hanganyagokat. A szakember számára ez az
összeállítás jó tájékoztató, a többi olvasó számára pedig az
elengedhetetlen, fáradságos kísérleti munka kitűnő példája. Megalapozó
a kilencedik fejezet gépi hang- és mondatelemzés, szövegfeldolgozás
technikájához, annak megértéséhez. A felhasználások példáiban térnek
vissza azok az ismeretek, amelyeket a matematikai modellezésről
általánosságukban szereztünk. Ezekben az összefüggésekben most már
jobban érthetőek a prozódiával kapcsolódó problémák, azaz a prozódia
szerepe a szöveg értelmezésében, megjelenítése és felismerése, mint a
közlés fontos eleme.
A tizedik fejezet mintegy megkoronázza az
előbbieket, ismerteti a beszédszintézis módszereit és eredményeit,
függő kérdéseit.
A záró rész mintegy hitelesíti mindazt a
felkészülést, amit ez az enciklopédikus könyv eddig áttekintett, a
tizenegyedik fejezetben az ember–gép dialógust, ezek szerepét a már
működő infokommunikációs szolgáltatásokban, elsősorban azokban,
amelyeket a tizenkettedik fejezet ismertet, a távközlési rendszerek
beszédminősítő eljárásait, a telefonról elérhető felolvasó,
tájékoztató szolgáltatásokat, beszéddel vezérelt automatikus
rendszereket, utastájékoztatókat, vakokat és gyengénlátókat támogató
rendszereket, a beszédtanítás gépi segítését.
Kézikönyvhöz illően hasznos és naprakész ismertetés
csatlakozik a vonatkozó szabványokról, közkeletű programokról,
referenciák a további gyakorlati ismeretekhez, sőt a függelékben nagy
beszédkorpuszok alapján még hangkapcsolati statisztikákat is közöl.
A zárszó, a témához illően kitekintést ad a várható
jövőről, arról a technológiáról, amely képes lesz a globális világ
embereinek kapcsolatát élőbbé tenni és az embert a szolgáló gépek
urává. Ebben a fogalmazásban kicsit benne van a recenzens reménye is.
Remény egy mélyebben emberi technológiai világban, amelyben a
technológia további felszabadítóként szerepel, az emberek pedig régi,
szép és kudarcos eszményeik jegyében újat alkotó, harmonikusabban
együttműködő, szabadabb egyénenként élhetnek.
Dicsérni kell a szerkesztést, amellyel logikus
egységben, világos vonalvezetéssel sikerült a sok, egyéni eredményt
felmutató szerzőt ebben az enciklopédikus szélességben összefogni.
Első hazai kísérletként ez példamutató eredmény.
Végül ne feledkezzünk el arról, hogy az
ismertetések mögött működik egy kimagaslóan eredményes és
nemzetközileg is számon tartott több évtizedes háttér, elsősorban a
szerzők többségét foglalkoztató BME TMIT (Budapesti Műszaki és
Gazdaságtudományi Egyetem Távközlési és Médiainformatikai Tanszék).
Mindez kapcsolódik az Akadémia Nyelvtudományi Intézetében és más
egyetemeken, így elsősorban említendőként Szegeden, valamint a PPKE-n,
Miskolcon és Debrecenben végzett munkához. Valamennyit támogatja a
kisebb-nagyobb vállalkozásokban, például az AITIA-ban és a
Morphologicban termékek előállításáig jutó tevékenység. A bőséges
irodalomjegyzék ezt mintegy kiegészítésként mutatja. (Németh Géza –
Olaszy Gábor szerkesztők: Beszédkutatás, beszédtechnológia,
beszédinformációs rendszerek. Budapest: Akadémiai Kiadó, 2010, 748 p.)
Vámos Tibor
az MTA rendes tagja
|