Hány szó van a magyar nyelvben?

Interjú Kiss Gáborral, a Magyar szókincstár főszerkesztőjével

"Szótárt lapozgatok. Van-e a szótárnál gazdagabb, élőbb, lelkesebb valami? Benne van a nyelvünk összes szava. Benne van a múltam, a jelenem és a jövendőm. Benne van az életem. Benne van a halálom is. Benne van a sorsom." (Kosztolányi Dezső, Pesti Hírlap, 1929.)

https://images.pexels.com/photos/6997/books-writing-reading-sonja-langford.jpg?auto=compress&cs=tinysrgb&h=750&w=1260

Halápy Ferenc: Főszerkesztő úr, ennek az interjúnak az idejét az Albertfalvai Helytörténeti és Iskolamúzeumban a ,,Magyar nyomtatott szótárak története’’ című kiállítás megnyitóján egyeztettük. A kiállításon 14 tematikus tárlóban hozzávetőlegesen 350 régi és újabb szótár látható. Kosztolányi megható szavai szerint ezekben a szótárakban benne van nyelvünk minden szava. Hány szó van nyelvünkben?

Kiss Gábor: Megmondhatatlan, hogy nyelvünkben hány szó van. Csak arra a kérdésre tudunk válaszolni, hogy hány szavunkat szótározták. A 1960-as évek elején megjelent hétkötetes Magyar értelmező szótárban 58.000 vastagbetűs címszó található. Az 1978-ban megjelent kétkötetes Magyar értelmező kéziszótár 68.000 szó jelentését magyarázza. Ezek szinkrón – azaz csak egy adott korszak nyelvét leíró – köznyelvi szótárak, tehát nincsenek benne tájszavak, nem találhatók meg benne nyelvünk már kihalt szavai, és nincsenek felsorolva bennük szakszavak.

Az MTA Nyelvtudományi Intézetében található archivális cédulagyűjteményt hatmillió cédula alkotja. A széles körű gyűjtést a magyar nyelv nagyszótára céljára kezdték meg több mint száz évvel ezelőtt. Ez a cédulagyűjtemény becslések szerint 550.000–600.000 magyar szóra ad példamondatot. Azonban meg kell jegyeznünk, hogy a szavaknak majdnem a felét csak egyetlen példa illusztrálja.
A múlt század végén a természettudósból és műegyetemi tanárból lett szótárkészítő, Szily Kálmán vezetésével összeállítottak és megjelentettek egy Czímszó-jegyzéket. Ez a jegyzék hét addig megjelent szótár 122.067 címszavát sorolja fel összesítve.
Az Akadémiai Kiadó által az 1960-as, 1970-es években megjelentetett kétnyelvű ,,nagyszótárak’’ (magyar–angol, magyar–német, magyar–orosz, magyar–francia, magyar–olasz, magyar–cseh) címszóállománya egyenként 80.000 és 120.000 szó között van. Azonban ha képzeletben összefésülnénk ezeknek a kétnyelvű szótáraknak a címszóállományát, akkor a közös lista hozzávetőlegesen 250.000 magyar szót tartalmazna.
Hogy mit is tekintünk szótározható magyar szónak, szakmai kérdés. Mert összetételekkel, továbbképzésekkel automatikusan és kissé erőltetetten, mesterségesen is alkothatunk új szavakat. Hiszen az egyik leggyakoribb szavunkból kiindulva ilyen továbbképzett szavakat alkothatunk: ember, embertelen, elembertelenedett, elembertelenedettség.
Úgy vélem, nagy szükség lenne egy olyan egynyelvű új értelmező szótárra, amely mai nyelvünk 100.000 szavát értelmezi, és ugyanakkor nem halasztható egy 180.000–200.000 szó mozgását, jelentésváltozását bemutató történeti szótár elkészítése sem.

A magyar nyelv értelmező szótáraA magyar nyelv értelmező szótára

Halápy Ferenc: Említette, hogy egyik leggyakoribb szavunk az ember szó. Ha a szavak előfordulásának ,,sikerlistáját’’ nézzük, mi a sorrend?

Kiss Gábor: Bármilyen furcsa, bár ha belegondolunk egyáltalán nem meglepő, hogy a szavak gyakoriságával a gyorsírók kezdtek el igazán komolyan foglalkozni az 1930-as években. A gyorsírók számára fontos volt a szavak gyakorisága, hiszen a rövidítések megalkotásánál fontos szempont volt ez. Éppen ezért Nemes Zoltán 1933-ban megvizsgálta a magyar parlamenti nyelv leggyakoribb szavait. A formaszavakat most nem említve, a következő sorrendet kapta: úr, nagy, kérdés, magyar, kormány, mond, miniszter. Ugyanő pár évvel később, 1941-ben szóstatisztikát készített egymillió szótagot felölelő újságszövegek alapján: magyar, nagy, pengő, év, kormány, mond, óra, új. Anélkül, hogy túlságosan is messzemenő következtetéseket vonnánk le, érdemes az 1941-ben készített újsággyakorisági szólistát összehasonlítani Csirik Jánosnak 1986-ban készített, ugyancsak újságok szavait feldolgozó listájával: év, sok, jó, nagy, mond, idő, új, ember. Az 1986-os listán, ha nem is szerepel az első szavak között, de előkelő helyezett a négyzetméter szó, mert Csirik János az újságok apróhirdetéseit is feldolgozta.
A magyar gépi nyelvészet – ma már számítógépes nyelvészetet mondanánk – egyik első apostola, Kelemen József vezetésével 1989-ben jelent meg az 1960-as, 1970-es évekből való irodalmi szövegrészleteket feldolgozó magyar szépprózai gyakorisági szótár. A feldolgozott szöveg mennyisége – ma a nagy memóriájú személyi számítógépek korában azt mondhatjuk, nem túl sok – 500.000 szó volt. Az irodalom leggyakoribb szavai: mond, most, ember, lát, jó, nagy, kéz, néz.
A gyakorisági listák fontosak a nyelvtanításban és a szótárak címszavainak kiválasztásánál is figyelembe kell vennünk őket.


Gyorsírással írt szöveg

Halápy Ferenc: A legtöbb ember a szótár szó jelentését a kétnyelvű szótárakkal azonosítja, hiszen iskoláinkban szinte csak az idegen nyelv oktatása során találkozik a tanuló szótárral. Pedig kívánatos lenne, ha az anyanyelvi nevelésnek részévé válna a szótárak és a kézikönyvek használatának gyakorlása. Mint a kiállításon is látjuk, az első kétnyelvű szótárunk Szenci Molnár Albert 1604-ben megjelent latin–magyar és magyar–latin szótára volt. Mikor jelentek meg más nyelvek kétnyelvű szótárai?

Kiss Gábor: Az első nyomtatott szótár, amely magyar részt is tartalmazott, Pesti Gábor hatnyelvű – latin, olasz, francia, cseh, német és magyar – fogalomköri szótára, Bécsben jelent meg 1538-ban. 55 fogalomkörbe sorolva, mintegy 4000 magyar szót tartalmaz. 1595-ben jelent meg Velencében a számos technikai újdonságot, köztük az ejtőernyőt is papírra vető feltaláló, Verancsics Faustus ötnyelvű szótára, 5000-nél több magyar szóval. Ez a szótár az ábécébe rendezett latin szavak mellé sorolja fel az olasz, német, horvát, magyar szavakat.
A ,,nagy művet’’, az első nyomtatott kétnyelvű szótárunkat, az ifjúként Károli Gáspár mellett a Vizsolyi Biblia nyomtatásánál segédkező Szenci Molnár Albert készítette el. Érdekességként említem meg, hogy Molnár Albert 1604-ben – Az ember tragédiájából is ismert – Rudolf császárnak ajánlotta művét és személyesen vitte bemutatni a kész szótárt Prágába. A császárnál, hogy mielőbb bejusson, maga Kepler járt közbe. Rudolf, ha nem is bőségesen, de tisztességesen, 50 arany forinttal jutalmazta Szenci Molnár munkáját. A szótár latin–magyar része kétszer terjedelmesebb, mint a magyar– latin rész, hiszen Szenci előtt senki sem sorolta fel és rendezte ábécébe a szótározható magyar szavakat. A szótár (reprint kiadásban is megjelent 1992-ben) szemléletesen mutatja be a XVI. és XVII. század fordulójának világát, világszemléletét. Meglepő, hogy milyen nagy mértékben tartalmaz utalásokat a klasszikus görög és római világra, megtudjuk például Achilles kocsisának nevét és számtalan görög, itáliai helynév található a szótárban. A szótár annak ellenére, hogy Amerika felfedezése után több mint száz évvel később keletkezett, a régi világképet tükrözi. Szenci szemérem nélkül tárgyalja a ,,kényes’’ szavakat, szinte a szabadszájúságtól sem riad vissza: Eugium, gen. n. [a szűzhártya]: az asszonyi állat szemérem testénec kapu hártyája, mely az Venus első ostromán rontatik el. Szenci Molnár Albert szótárát –- ma minden kiadó csak álmodik ilyenről – átdolgozásokkal évszázadokig használták, Pápai Páriz Ferenc 1708-ban, Bod Péter 1782-ben ,,igazított’’ rajta.
A latin–magyar szótárakat jóval később követik más nyelvek szótárai. Az első német–magyar, magyar–német szótárt Márton József készíti és jelenteti meg 1799-ben. Magyar–francia szótár a múlt század közepén készül, magyar–olasz és magyar–angol szótár a múlt század nyolcvanas éveiben hagyja el először a sajtót. Korábban az angolul, franciául, olaszul tanulni vágyók német–angol, német–francia és német–olasz szótárakat használtak.


Pesti Gábor: Nomenclatura sex linguarum, azaz hatnyelvű szótár (reprint)

Halápy Ferenc: Egyre többet hallani ismét, hogy vége a Gutenberg galaxisnak. A magyar nyomtatott szótárak történetét bemutató kiállításon nézelődve is felvetődik a látogatóban: nagyszerű szótárakat nyomtattak elődeink, de nekünk szükségünk van-e még a nyomtatott szótárakra az elektronizált, számítógépes szótárak korában?

Kiss Gábor: A nyomtatott könyv alakú és a számítógépesített, CD-alapú szótárak még sokáig párhuzamosan fognak együtt élni. Más helyen, más módon, más célra használjuk őket. Számítógépes szövegszerkesztő használata közben a gépi szótár használata a praktikus, de egy szó után nyomozva még mindig egyszerűbb levenni a polcról a szótárt és felütni, mint bekapcsolni ezért a gépet és elindítani egy adott szótárprogramot.
A gépi szótáraknak van egy többlet szolgáltatásuk a nyomtatott szótárakkal szemben, az, hogy bennük ,,keresztbe-kasul’’ kereshetünk, és nem csak úgy, mint a nyomtatott szótárakban, a címszavak mentén, lineárisan. Magasabb szintű, más dimenziójú szótárhasználat lehetséges így. Hallatlan nagy élmény, mikor egy számítógépes szótárban egy belső egységre, például az orvosi szakkifejezésekre, vagy a szleng minősítésű szavakra kereshetünk rá.
A számítógép nemcsak a szótár használóját segítheti, hanem megkönnyíti a szótárszerkesztést is. Míg korábban a cédulák rendezése emésztette fel a szerkesztésre szánt idő nagy részét, ezt ma teljes egészében a gépre bízhatjuk. Nem is szólva arról, hogy ma már több tízmillió szót tartalmazó korpuszok, szöveges adatbázisok állnak a lexikográfusok rendelkezésére, amelyekben megfelelő keresőprogrammal hatékonyan vizsgálhatják egy-egy szó környezetét, viselkedését.

Halápy Ferenc: Milyen feladatai vannak a magyar szótáríróknak, lexikográfusoknak a XXI. század küszöbén?

Kiss Gábor: Vannak mulasztásaink, melyeket mihamarabb pótolnunk kell. Számba kell vennünk szótári örökségünket és most elsősorban a XX. század szótári termésére gondolok. El kell készítenünk a magyar szótárak bibliográfiáját, hiszen a magyar szótárak átfogó könyvészetét utoljára Sági István készítette el 1922-ben.
A magyar szótáríróknak is fel kell készülniük az Egyesült Európához való csatlakozásra. Az EU egyes tagországainak megismeréséhez az adott ország nyelvének magas szintű ismerete is elengedhetetlenül fontos. Ehhez szótárak szükségesek. Kell, csak példaként említve portugál, dán, görög és még egy sor más korszerű szótár. A kétnyelvű szótárak mellett különböző típusú egynyelvű – értelmező, szinonima-, történeti és folytathatnám a sort – szótárakban a nagy szótáríró elődeink nyomdokain haladva, kell felsorolnunk és számba vennünk anyanyelvünk régebbi és legújabb szavait.
Éppen ezért a magyar egyetemeken mind több szakon kell oktatni szótártani ismereteket. Ezzel párhuzamosan el kell indítani a magyar lexikográfusok szervezett, felsőfokú képzését. A szótárszerkesztőknek tovább kell adniuk tapasztalataikat. Nem vagyunk olyan gazdagok, hogy megengedhessük magunknak, hogy minden egyes szótár szerkesztőgárdája maga dolgozza ki a szótárkészítés technológiáját, újra és újra olyan problémákat oldjon meg, melyekkel kollégái már megbirkóztak.

A fenti interjú eredetileg a Könyvhét című kulturális kéthetilap 1999. március 25-i számában (III. évf. 6.) jelent meg.