A Magyar Tudományos Akadémia folyóirata. Alapítva: 1840
 

KEZDŐLAP    ARCHÍVUM    IMPRESSZUM    KERESÉS


 KÖNYVSZEMLE

X

Sipos Júlia gondozásában

 

 

A magyar beszéd


– Kinek ajánljuk ezt a könyvet? – teszik fel a szokványos kérdést a szerkesztők, és ezt hosszú felsorolás követi. A recenzens válasza rövidebb: mindenkinek! Hiszen a beszéd legemberibb sajátunk, ami a gondolkodás kezdeteitől fogva izgatta az emberről gondolkodókat. Izgalmas tükrözésünk, amivel az egyik ember a másik számára igyekszik hangokból képzett tükröket alkotni. A hang gépi átvitelével és rögzítésével új, hatalmas tükröt kaptunk, hiszen az egyéntől elszakadó módon és ugyanakkor az egyéneket a korábbi mértékkel összehasonlítva működik az, amit a régiek az elszálló jelzővel illettek. Ez az embertől elválasztó és embereket összekötő tükör valahol a telefóniával és a gramofonnal kezdődött, bár ha például Kempelen Farkasra hivatkozunk, akkor mondhatjuk, hogy egyidejűleg fejlődött az ipari forradalommal, az ember egész életmódját, természethez való viszonyát forradalmasító két évszázaddal.

Ez a kontextus nagyon fontos az ajánlás szempontjából. Közléseink ősi módjának ipari forradalma innen nézve lett és lesz egész gondolkodásunkban és életvitelünkben meghatározó. A példákat hosszan sorolhatjuk, de a mobiltelefónia minden képzeletet felülmúló sebességű és általános terjedése mutatja, hogy itt olyan valamiről van szó (íme: van szó), ami minden korábbi gazdasági, társadalmi, életmódbeli korlátot átlépett. Talán csak Anatole France-nak a huszadik század legelején írt zseniális meglátása jósolta meg ennek a találmánynak a létrejöttét és kiterjedését a föld minden lakójára, összekötve ezt a víziót a társadalmakat és az együttléteket átformáló hatásával.

A tükörhasonlatnál maradva: a tükör tulajdonságai, a kapcsolódó fizikai jelenségek megismerése e mindenre kiható szerepben formálni képesek a világnak és azon belül is az életfolyamatoknak az ismeretét és szemléletét. Másképp és más aspektusokban alakul ez a tudás a hang és a beszéd kibocsátó és befogadó működésének vizsgálata során, és ezért is általános feladat mindennek a megismerése, tudatosulása és kezelése.

A számunkra prioritásként élő magyar beszéd és annak antropológiai és technológiai vonásai így válnak közhasznú érdeklődésünk tárgyává. Erről eddig sok résztanulmány és részösszefoglaló ellenére sem készült a kor ismerettömegével együtthaladó enciklopédikus áttekintés. Most itt van, és ennek jegyében ünnepelhetjük, ajánlva a megszólított Mindenkinek.

Itt kell előrebocsátani a mostani recenzens szerepét. Ez az írás nem a részletismeretekben gazdag szakértő elemzése, nem az elengedhetetlen szakmai kritika. Nehéz is lenne az egész könyvet egy lektorra bízni, hiszen a szerteágazó ismeretanyagot három szerkesztő és tizenhat szerző foglalta össze egy hétszáz oldalra korlátozott terjedelmű könyvben, meg a csatolt honlapon. Az ismertető egy kisebb feladatrészben, a szövegmegértésben szerzett némi jártasságot, a többit egy kapcsolódásokat kereső és az egészet átfogó érdeklődéstől hajtott olvasó írja.

Ehhez a szemlélethez közelállóan az első fejezet a beszéd és az információs tásadalom viszonyáról szól, véleményem szerint a terjedelmi korlátokat is tekintve túlságosan röviden. Ha lesz új kiadás, ezt a bevezést teljesebbé kellene tenni. A beszéd komplex szerkezetéről szóló második fejezet ezt a hiányt igyekszik részben pótolni, és nagyobb áttekintést adni a könyvben szereplő alapproblémákról. A harmadik fejezet a beszéd fizikai és fiziológiai jelenségeiről szól, közérthetően, ismereteinket összefoglalva és a mai tudás színvonalán frissítve. Ez a fejezet az egyik legközhasznúbb és -teljesebb része a munkának. A bevezetések utolsó, negyedik fejezete a beszéd és az írás kapcsolatáról, a feljegyzett hangalakokról, a beszéd és a szavak tagolásának kérdéseiről és mindezek néhány magyar nyelvi sajátosságáról szól.
A következő nagyobb enciklopédikus egységben az ötödik és hatodik fejezet a beszéd szerkezetét ismerteti, a hangok különböző sajátosságait, ezek között a magyar hangok specifikumait, a szegmentálások hangzási és fiziológiai tulajdonságait. A szegmentálás magasabb fokán, az ún. szupraszegmentális szerkezetben jelenik meg az olvasó számára különösen érdekes prozódia. Ezek az olvasói, előadói és hallgatói műveltségnek alapelemei, ezért is érdemes a barátkozás nemcsak a fogalmakkal, hanem alapvető ismeretekkel a korábban retorikai és versmondási problémákról gondolkodók számára.

Ezek az alapok természetes logikával vezetnek a ma legizgalmasabb kérdéscsoportjához, a beszédtechnológiához. Maga a megnevezés sem

 

 

régi, és csak a huszadik század technológiai fejlődése formálta összefüggővé a mintavételezés, kvantálás, frekvenciaanalízis, statisztika és predikció matematikai alapjait a jelfeldolgozás, kódolás megfigyelt és értelmezett reprezentáció(já?)val. Ez, a hetedik fejezet elkerülhetetlenül megkövetel némi alapvető egyetemi matematikai ismeretet, de szerintem nem többet, mint amit ma már nemcsak egy mérnöktől, de egy közgazdásztól, társadalmi folyamatokat elemző szociológustól vagy a korszerű képalkotó és egyéb diagnosztikai eszközöket felhasználó orvostól is el lehet várni. Az egész fejezet mögött, a beszédanalízis tükrében egy olyan reprezentációs szemlélet áll, amely a modern gondolkodó értelmiségit áthatja a maga világának összefüggéseiben. A modellezésnek itt is két szintje jelenik meg: az első a jelenség leírása a fizika általánosító nyelvén és következő absztrakcióban, a fizikusi elbeszélés matematikai fogalmazásában. Ennek a reprezentációs folyamatnak a tudatos és kritikus követése az alapja mai haladásunk gondolkodásmódjának.

Így közeledünk a beszédtechnika gyakorlatához. A nyolcadik fejezet azokat az elméleti megfontolások alapján létrehozott kísérleti adatbázisokat ismerteti, amelyek a gépi feldolgozás összehasonlító alapjául szolgálnak, mintákat, amelyekre illeszteni lehet a feldolgozandó hanganyagokat. A szakember számára ez az összeállítás jó tájékoztató, a többi olvasó számára pedig az elengedhetetlen, fáradságos kísérleti munka kitűnő példája. Megalapozó a kilencedik fejezet gépi hang- és mondatelemzés, szövegfeldolgozás technikájához, annak megértéséhez. A felhasználások példáiban térnek vissza azok az ismeretek, amelyeket a matematikai modellezésről általánosságukban szereztünk. Ezekben az összefüggésekben most már jobban érthetőek a prozódiával kapcsolódó problémák, azaz a prozódia szerepe a szöveg értelmezésében, megjelenítése és felismerése, mint a közlés fontos eleme.

A tizedik fejezet mintegy megkoronázza az előbbieket, ismerteti a beszédszintézis módszereit és eredményeit, függő kérdéseit.

A záró rész mintegy hitelesíti mindazt a felkészülést, amit ez az enciklopédikus könyv eddig áttekintett, a tizenegyedik fejezetben az ember–gép dialógust, ezek szerepét a már működő infokommunikációs szolgáltatásokban, elsősorban azokban, amelyeket a tizenkettedik fejezet ismertet, a távközlési rendszerek beszédminősítő eljárásait, a telefonról elérhető felolvasó, tájékoztató szolgáltatásokat, beszéddel vezérelt automatikus rendszereket, utastájékoztatókat, vakokat és gyengénlátókat támogató rendszereket, a beszédtanítás gépi segítését.

Kézikönyvhöz illően hasznos és naprakész ismertetés csatlakozik a vonatkozó szabványokról, közkeletű programokról, referenciák a további gyakorlati ismeretekhez, sőt a függelékben nagy beszédkorpuszok alapján még hangkapcsolati statisztikákat is közöl.

A zárszó, a témához illően kitekintést ad a várható jövőről, arról a technológiáról, amely képes lesz a globális világ embereinek kapcsolatát élőbbé tenni és az embert a szolgáló gépek urává. Ebben a fogalmazásban kicsit benne van a recenzens reménye is. Remény egy mélyebben emberi technológiai világban, amelyben a technológia további felszabadítóként szerepel, az emberek pedig régi, szép és kudarcos eszményeik jegyében újat alkotó, harmonikusabban együttműködő, szabadabb egyénenként élhetnek.

Dicsérni kell a szerkesztést, amellyel logikus egységben, világos vonalvezetéssel sikerült a sok, egyéni eredményt felmutató szerzőt ebben az enciklopédikus szélességben összefogni. Első hazai kísérletként ez példamutató eredmény.

Végül ne feledkezzünk el arról, hogy az ismertetések mögött működik egy kimagaslóan eredményes és nemzetközileg is számon tartott több évtizedes háttér, elsősorban a szerzők többségét foglalkoztató BME TMIT (Budapesti Műszaki és Gazdaságtudományi Egyetem Távközlési és Médiainformatikai Tanszék). Mindez kapcsolódik az Akadémia Nyelvtudományi Intézetében és más egyetemeken, így elsősorban említendőként Szegeden, valamint a PPKE-n, Miskolcon és Debrecenben végzett munkához. Valamennyit támogatja a kisebb-nagyobb vállalkozásokban, például az AITIA-ban és a Morphologicban termékek előállításáig jutó tevékenység. A bőséges irodalomjegyzék ezt mintegy kiegészítésként mutatja. (Németh Géza – Olaszy Gábor szerkesztők: Beszédkutatás, beszédtechnológia, beszédinformációs rendszerek. Budapest: Akadémiai Kiadó, 2010, 748 p.)

Vámos Tibor
az MTA rendes tagja