Jókai minden szót ismert?

Az írói szókészlet feldolgozásáról

Az írás eredeti megjelenési helye: Verso irodalomtörténeti folyóirat 2021/2: 61–66.

Mit kezdhetünk 10 millió szóval? Ennyiből áll ugyanis feltehetőleg Jókai Mór szókészlete,[1] azonban azt máig nem tudjuk, hogy ez a becsült szókészlet vajon hány önálló szótári szót jelenthet. Hogy mi a valós szerzői szómennyiség, arra a Jókai-enciklopédia nem ad választ, ugyanakkor az eddigi lexikológiai jellegű eredményeket egységes alapra hozza. Jókai szókészletéről még nem készült átfogó statisztikai felmérés, ahogy általában véve a lexikográfiai produktumokon belül is alulreprezentált egy-egy szerző szókincsének a feldolgozása. A szerzői életművet feldolgozó lexikográfiai munkák ugyanakkor meglehetősen eltérőek: a lassan készülő, adatgazdag, részletes szemantikai, stilisztikai kidolgozottságot mutató (akár a teljes életművet, akár annak részleteit feldolgozó) szótárak[2] mellett megtalálhatók a formálisabb szerkezetet mutató, informatikai megoldásokat igénybe vevő és láttató gyűjtemények is.[3]

A hagyományos, papíralapú munkák esetében a szócikkszerkezetek merevek, a szóértelmezések gyakran túl- vagy alulmagyarázók, mivel a papíralapú megjelenés számos korlátozó funkció alkalmazását teszi szükségessé, ami jelentheti a példaanyag szűkítését, bonyolult utalórendszer vagy egyéb terjedelmi megszorítás kialakítását. Napjainkban az informatikai háttérnek köszönhetően az alapvető funkciók új alapokra helyeződnek, a szövegek tárolása, adatkezelése könnyebbé válik. Ez a változás nemcsak a lexikográfusok munkáját könnyíti meg, hanem egyúttal megváltoznak a szótárféleségekkel szemben kialakított felhasználói elvárások is.[4] Egyre inkább teret hódít magának a szűkebb értelemben vett nyelvi ábrázolás mellett az enciklopédikus jelleg érvényesülése is, ahol a nyelvi leírásokon túl további tudáselemek is a szócikk részévé válnak.

Jókai-enciklopédia
Balázs József Attila, Kiss Gábor: Jókai-enciklopédia

A szövegértelmezés fókuszba állításával a hagyományos szótári kereteken túlmutató tartalomgazdagításnak egy speciális módját választotta Balázsi József Attila és Kiss Gábor a Jókai-enciklopédia készítésekor. Maguk a szerkesztők munkájukat a szótár és a lexikon ötvözetének tekintik, amely egyfelől szótár, mivel szavakat magyaráz, értelmez; másfelől enciklopédia, mivel tárgyi tudást, ismereteket ad át. Az elkészült szótár nem tartalmazza a terjedelmes életmű összes szavát, és nem adja meg a felvett címszavak összes előfordulását sem. A válogatás elve vállaltan szubjektív: az egyes köznevek értelmezésén túl személyekről, történelmi eseményekről, földrajzi helyekről, korabeli technikai újításokról ad információt. Az életműből készített teljes digitalizált szövegkorpusz feldolgozása lehetőséget adna egy bővebb, akár teljes szóanyagú és az előfordulásokat szélesebb merítésben (akár teljességükben) bemutató munka létrehozására, azonban az életmű mérete miatt ehhez egy jóval nagyobb kutatócsoport munkájára volna szükség. Az enciklopédikus jelleg kialakításában a műfaji előzményeket házasították a szerkesztők: a kritikai kiadás szövegforrása mellett a tárgyi jegyzetanyagra és a Jókai-szótár[5] szócikkeire támaszkodtak. A felhasznált kiadások közé tartoznak az Akadémiai Kiadó gondozásában megjelent kritikaikiadás-sorozat művei és az Unikornis Kiadó Jókai-díszkiadás regényei. A Jókai-enciklopédiához így összesen 74 kötetet dolgoztak fel a szerkesztők: regényeket, kisregényeket, elbeszélésgyűjteményeket. Összesen 28850 címszót, emellett 2270 utaló címszót tartalmaz az enciklopédia, valamint 1150 személyről közöl információkat. Az egységesítés előnye, hogy a tárgyi jegyzetanyag ezáltal strukturáltabb elrendezést kapott, és a többször előforduló szavak nemcsak az adott szöveghelyet magyarázzák, hanem a szótári és a jegyzetekben lévő magyarázat kiegészíti egymást, árnyaltabbá teszi az értelmezést. Adott esetben a címszók magyarázatának pontosítása, javítása, kiegészítése, idegen címszavak esetén forrásnyelvi megjelölésük is megtörtént. Hátránynak tekinthető a címszavak szubjektív alapú válogatása, valamint hogy a Jókai-szótárból átvett szavak továbbra is forrásjelölés nélkül maradtak – ahogy eredetileg a szótárban is szerepeltek –, így az értelmezések példamondat nélkül állnak, és nem derül ki, hogy melyik mű melyik szöveghelyét magyarázzák, például filkót üt ’kártyázik’, kezeslábas ’épkézláb ember’. A munka során felhasznált heterogén forrásokból adódik, hogy nem egységes a szócikkek felépítése, ami némileg felemás képet ad az olvasó számára, ugyanakkor az azonosított, visszakereshető forráshelyek száma így is jelentős: 17050 címszó tartalmaz valamilyen forrásmegjelölést, s mivel egy címszóhoz több forrásmegjelölés is tartozhat, összesen 24500 egyedi forráshely kereshető vissza.

joka-enciklopedia-hangulatkep.jpg

A Jókai-enciklopédia fő feladatának tekinti, hogy hasznos segédkönyvként támogassa Jókai regényeinek értő olvasását. Így nem a szókincs lajstromozása, a teljes írói életművet reprezentáló statisztikák létrehozása volt a cél, hanem az értelmezés támogatása. A szerkesztők céljaikat az alábbiakban határozták meg: a mai olvasó számára nehezen érthető szavak magyarázata; regények idegen szavainak, kifejezéseinek a fordítása; ismeretek közlése a regényszereplőkről; történelmi eseményekhez kapcsolódó szavak, fogalmak bemutatása; földrajzi helyek leírása; a szókincs gazdagságának, változatosságának a láttatása; a XIX. század tudományos világlátásának illusztrálása; segédeszköz az írói stílus, szókészlet tanulmányozásához; segédlet, előmunkálat egy későbbi szótárhoz; ismeretek bővítése. Minthogy az enciklopédia ilyenformán válogatott szókincset tartalmaz, így óhatatlanul szubjektív szerkesztői mérlegelés kérdése, hogy mi válik végül címszóvá. A válogatás szempontja miatt kézenfekvő, hogy nem minden olvasói igény teljesül. Ugyanakkor azt is látnunk kell, hogy aki a XIX. század szaknyelvi, nyelvjárási, korabeli köznyelvi, irodalmi szókészletében szeretne kutakodni, annak nincs könnyű dolga sem a rendelkezésre álló lexikográfiai munkák, sem a bennük feldolgozott szókincsmennyiség tekintetében. A mai, korszerű igényeknek megfelelő szótárak közül, amelyek a teljes XIX. századot lefedik, a készülő akadémiai nagyszótár alapvető fontosságú referencia volna, de a teljes készültségtől még messze áll, így egy-egy szómagyarázat nemritkán önálló lexikográfiai feltárást igényel. Ebből a szempontból mindenképpen értékelendő, hogy az enciklopédia egy hatalmas nyelvi gazdagságú szerző speciális szókészletébe enged bepillantást, és ad némi eligazítást. Az ideális megoldás természetesen a teljes lajstromozás és feldolgozás lenne.

jokai-enciklopedia-a-szerkesztok-balazsi-j-a-kiss-g-ff.jpgA szerkesztők: Balázsi József Attila és Kiss Gábor

Tematikailag az alábbi csoportok alkotják a címszavakat: tudományos terminusok, például refraktor; jogi szakkifejezések, például hajadonjog; kártyaműszók, például sánta; diáknyelvi kifejezések, például hálpaklacs; tolvajnyelvi szavak, például ladino. A tulajdonnevek kifejezetten nagy számban képviseltetik magukat: ide tartoznak a történelmi személyek, például Antonio Canova; a mitológiai alakok, bibliai személyek, például Enkeladosz, Mikhál; regényszereplők nevei (terjedelmi okok miatt csak egy részük), például Bánfi Dénes. A földrajzi nevek korabeli és mai, többnyelvű változattal is szerepelnek, például Dancka, Danczka, Gdańsk; valamint műcímek, folyóiratok is megtalálhatók, például az Életképek.

Az enciklopédia külön jelzi az író saját szóalkotásait (például szívkinyitó, zuhatar), továbbá illusztrálja azt is, hogy az egyéni nyelvezet nemcsak az új szavak kreálásában mutatkozik meg, hanem tájnyelvi elemek jelentésének gazdagításával (például geszt, milling) vagy tükörfordításokkal (például csomaghajó ang packet boat), esetleg magyar kifejezések idegen nyelvre való fordításával (például ego tibi musicabo ’majd elhúzom én a nótádat’), valamint latinosított szerkezetek létrehozásával is (például ad ugrandum! ’ugorj hát!’). Jókai nyelvezete gazdag idegen szavak használatában, az enciklopédia görög, latin, héber, német, angol, francia, olasz, török, szlovák, finn, holland, jiddis, lengyel, portugál, román, svéd, arab, grúz, hindi, japán, maláj, mongol, perzsa, szanszkrit, tatár, tibeti nyelvekből kölcsönzött szavakat is felvesz. A Jókai szókészletét, szóhasználatát jellemző jegyekről, nyelvezetéről, helyesírásáról, műveinek legfontosabb forrásairól az előszóban részletesen olvashatunk.

jokai-enciklopedia-oldalkep.jpgEgy oldal a könyvből

A szócikkek felépítése könnyen áttekinthető, a kidolgozott szócikkek esetében láthatóan érvényesül az értelmezői funkció előtérbe helyezése. Azok az információk, amelyek a hagyományos szótári nyelvi jellegű leírásokhoz tartoznak, mint például a szófaji megjelölés, nem jelennek meg. A magyarázatok rövidek, tömörek, lényegre törők, ebből a szempontból segítik és támogatják az adott szöveghely értelmezését. Ugyanakkor nem feltétlenül teljesül ez akkor, ha többjelentésű szóról van szó, és a szócikk nem adja meg a vonatkozó forráshelyet, hiszen ilyenkor az olvasó kompetenciájára és egyéni döntésére van bízva, hogy a megadott magyarázatok közül melyiket választja a kontextus értelmezésére, ami akár további bizonytalansághoz vezet. A jelentésszerkezet nem túlrészletező, nem hierarchikus, nincs fő- és aljelentéseket reprezentáló szerkezet, ami kézenfekvő és szükségszerű megoldás jelen esetben, hiszen az enciklopédia nem ábrázolja egy adott szó összes előfordulását, és nem adja meg a teljes jelentésszerkezetet. A tárgyi, magyarázó jegyzetanyag szócikké formálása előremutató gondolat, hiszen felvételük szintén a magyarázatot igénylő szöveghelyek megértését teszi könnyebbé.

A szócikkek felépítése egységesen strukturált, azonban az egyes szócikkek tartalmukat tekintve eltéréseket mutatnak, hiszen ugyanabba a formai egységbe a szótári, a lexikonszerű és a jegyzetszerű leírások is beletartoznak, ami ugyanabban a struktúrában olykor divergál. A magyarázatok egy része a hagyományos szótári leírásokban megtalálható körülíró szerkezet alkalmazásával adja meg a címszavak értelmezését, például gőzsajtó ’gyors nyomdászati eljárás’. Más részük a tárgyi jegyzetek különféle értelmező elemeit tükrözi. Találunk köztük fordítást és átiratot is, például meine Mittel erlauben mir das (ném) ’anyagi helyzetem megengedi’; Megtvdvc az reeghi ioo […] ’Megtudjuk, az régi jó […]’. Címszói szerepkört kaptak a szónál nagyobb, nem kötött frazeológiai egységek közül még idegen nyelvi félmondatok, akár egész mondatok is, például olimpi istenek majorum et minorum gentium gyülekezete. Többször találkozni többelemű szószerkezetekkel, mondatokkal, illetve azok részleteivel, például hét órakor a pesti drámai színházba, onnan az operaházba, onnan a népszínházba. Az ilyen típusú címszavak egyes elemei számítógépes platformon könnyen megtalálhatók lennének, könyv formátumban azonban nagyon esetleges az egyes címszavak megtalálása, főleg, hogy a keresést utalók sem segítik. A pesti drámai színház például a P betűnél is megtalálható, de más magyarázattal, mint ahogyan a hét órakor a pesti drámai színházba, onnan az operaházba, onnan a népszínházba szócikknél korábban szerepelt. Az ismétléseket és átfedéseket érdemes lett volna az enciklopédiában mutatókkal összekapcsolni, hiszen éppen a szócikkszerkezetnek és a szótárszerűségnek ez a funkciója segítene abban, hogy a tárgyi jegyzetek elszigeteltségét, egyszeri magyarázatát kitágítsa más kontextusok beemelésével.

jokai-enciklopedia-a-konyv.jpg

Az annotációkból átemelt értelmező magyarázatok több esetben nem a jelentést, értelmezést adják meg, hanem az utalást fejtik meg (olykor további magyarázatot igénylő kifejezésekkel): Csokonai, a híres poéta, harmincéves korában dohánytermesztővé lett ’célzás a költő botanizálgatására’; más esetben egészen konkrét tartalomkifejtéssel találkozunk, például két egymástól elvált házastárs ’Schintzler és Crusenstolpe is ír arról, hogy Nariskin Zsófia halála visszatérítette Sándor cárt a feleségéhez, mert Erzsébetnek is voltak könnyei vetélytársnője leánya számára’. Ezek a címszói elemek nem állandósult szókapcsolatok, hanem több elemből álló magyarázandó szöveghelyek, címszóvá emelésük nem szokványos, keverednek a rögzült, kötött szerkezetekkel, megtalálásuk esetleges. Furcsának hatnak a szintén nem kötött frazeológiai szerkezetű, nem egyes szám harmadik személyű alakokat tartalmazó formák, például el is csakliztam, előszedték a jelmezképeket. Más esetben nem konkrét kontextuális értelmezést, hanem valamiféle fogalmi kijelölést találunk, például Ha a tűvel megszúrom ujjamat, rólad gondolkozva, hűtelen voltál akkor hozzám, kedvesem ’nem népi hiedelem’.

A Jókai-enciklopédia válogatásanyagából is kiviláglik, hogy a szerzői idiolektus jövőbeni módszeres feldolgozása számos jelentős eredménnyel gazdagítaná a Jókai prózanyelvéről és retorikai megoldásairól való eddigi tudásunkat, ezen túlmenően nagyban hozzájárulna a korabeli beszélt nyelv jegyeinek az alaposabb megismeréséhez. Mindez jóval túlmutat a szerzői szókészlet önmagában való feltárásán, hiszen a meglévő történeti szótárak anyaga mellett a korszak feldolgozottsága is nagyságrendekkel bővülne. A Jókai-enciklopédiában rendszerezett tudást még jobban ki lehetne aknázni, ha ez az anyag számítógépes környezetben, megfelelő keresési módszerekkel lenne használható, az adott szövegforráshoz kapcsolódva. A szerkesztők módszertani szempontból remek érzékkel ragadták meg a rendelkezésre álló szótári anyag mellett a kritikai kiadás jegyzetapparátusában rejlő lehetőségeket. A megvalósítás során kitágultak a nagyon merev keretek, ami a feldolgozott szócikkek sokféleségét eredményezte eltérő címszói szerepekkel, értelmezési keretekkel – mindez felveti egy cizelláltabb struktúra lehetőségét és igényét.

Mindebből legalább két fontos tanulság adódik: Jókai teljes szókészletének majdani feltárása, szókincsének értelmező jellegű, átfogó feldolgozása hiánypótló vállalkozás volna a korszak kutatói számára. Ehhez azonban nélkülözhetetlen feladat lenne megtalálni azt a korszerű lexikográfiai modellt, amely egyben tartja a különféle típusú, de alapvetően mégis a szöveghelyek értelmezésére irányuló eltérő magyarázatformákat. Ennek többféle útja lehet, hiszen a digitális lexikográfia nagyon eltérő megoldásokat kínál. Szóba jöhet többek között az írói szótár és a kritikai annotációk közös platformjának a modellje egy tudásalapú rendszerben,[6] a szemantikus információk digitális feldolgozhatóságának és kereshetőségének a kialakítása,[7] a korpuszalapú, a számítógépes nyelvészet lehetőségeit kiaknázó szótár[8] vagy akár az enciklopédikus alapon (LOD) létrehozott modell is.[9] A Jókai-enciklopédia amellett, hogy összegzi és rendszerezi az eddigi lexikográfiai eredményeket a szerző szókészletével kapcsolatban, ezeknek a jövőbe mutató kérdéseknek a továbbgondolására és megoldására is sarkall.

Kiss Margit

[1] Wacha Imre, Utószó a Jókai-szótárhoz = Balázs Géza, P. Eőry Vilma, Kiss Gábor, J. Soltész Katalin, T. Somogyi Magda, Jókai-szótár 1–2., Bp., Unikornis, 1994, 437–446.

[2] A hazai munkák közül például: Petőfi-szótár, szerk. J. Soltész Katalin, Szabó Dénes, Wacha Imre, Gáldi László, Bp., Akadémiai, 1973–1987; Juhász Gyula költői nyelvének szótára, szerk. Benkő László, Bp., Akadémiai, 1972.

[3] A hazai munkák közül például: Balassi-szótár, szerk. Jakab László, Bölcskei András, Debrecen, Debreceni Egyetem, 2000 (Számítógépes Nyelvtörténeti Adattár 8.); A Jókai-kódex mint nyelvi emlék – szótárszerű feldolgozásban, szerk. Jakab László, Debrecen, Debreceni Egyetem, 2002 (Számítógépes Nyelvtörténeti Adattár 10.).

[4] de Schryver, Gilles‐Maurice, Lexicographers’ Dreams in the Electronic‐Dictionary Age, International Journal of Lexicography, 2003/2, 143–199.

[5] Jókai-szótár 1–2., szerk. Balázs Géza, P. Eőry Vilma, Kiss Gábor, J. Soltész Katalin, T. Somogyi Magda, Bp., Unikornis, 1994.

[6] Tamás Mészáros, Margit Kiss, Knowledge Acquisition from Critical Annotations, Information, 2018, 1–10.

[7] DanteNetwork, https://dantenetwork.it/, DanteSources, https://dantesources.dantenetwork.it/progetto.html

[8] Culpeper, Jonathan, A new kind of dictionary for Shakespeare’s plays: An immodest proposal = Ravassat, Mireille and Culpeper, Jonathan (eds.) Stylistics and Shakespeare: Transdisciplinary Approaches, Continuum, London, 2011, 58–83.

[9] BabelNet, https://babelnet.org/