Szótárak szótára: a SzóTudásTár

A tinta könyvkiadó online egynyelvű magyar szótárrendszere

Az írás eredeti megjelenési helye: A szótár az oktatásban - A lexikográfiától a szótárhasználatig. (Lexikográfiai füzetek 11.) TINTA Könyvkiadó, Bp., 2022, 161-172.

A nyelvről és a szó helyéről a nyelvben

A nyelv különös helyet foglal el az emberiség és az egyes egyén életében. Abban majdnem mindenki egyetért, hogy a nyelv az emberiség legnagyobb „találmánya”. Eredete homályba vész. Csak csodálkozhatunk és ámulhatunk, hogy a világ hozzávetőlegesen 4000 nyelvén ki tudjuk fejezni gondolatainkat, érzelmeinket, közölhetjük a legfrissebb tudományos felfedezéseket, és költői alkotásokban mély emberi érzéseket fogalmazhatunk meg.

Nem véletlen, hogy kiemelkedő egyéniségek csodálattal szóltak az emberi nyelvről.

Bárczi Géza (1894–1975), a XX. század talán legnagyobb magyar nyelvésze így foglalja össze az emberi nyelv fontosságát: „Az emberi elme nagyszerű alkotásai között aligha van még egy, mely alapvető fontosságban vetekedhetnék a nyelvvel. A nyelv, gondolataink, érzelmeink kicserélésének ez a mindennapi használatú eszköze mindennemű emberi fejlődésnek egyik legfőbb tényezője, sőt föltétele. Kétségtelen, hogy a tagolt, hajlékony emberi nyelv az emberiség legnagyszerűbb vívmánya, melyet a mai változataiban a nemzedékek végeláthatatlan sorainak állandó erőfeszítése teremtett meg.”

Werner Heisenberg (1901–1976) Nobel-díjas atomfizikus A rész és az egész című könyvében olvashatjuk a következő gondolatot a nyelv állandóságáról, ugyanakkor hajlékonyságáról is: „Nyelvünknek furcsa, változékony jellege van. Sohasem tudhatjuk, hogy mit jelent egy-egy szó egészen pontosan. Szavaink értelme nagymértékben függ attól, hogy milyen módon rendezzük mondattá őket, és hogy milyen körülmények között beszélünk, és még számtalan hasonló másodlagos tényezőtől. Az atomfizika pedig élesen mutatja, hogy a legmegbízhatóbbnak vélt fogalmaink is csak bizonyos, igen szűk korlátok között maradnak érvényben.”

A XVI. században élt taoista bölcselő, Tu Csi Hsui kiemeli a nyelv közösségi jellegét, hangsúlyozza, megfogalmazza a beszéd „kétirányúságát”: „A beszédem akkor lesz egy velem, ha jóakarattal igazat és fontosat mondok annak, akit megillet.”

Számunkra, magyar anyanyelvűek számára különös jelentősége van a nyelvnek. Bátran állíthatjuk, hogy nekünk a magyar nyelv a legnagyobb hungarikum. Ezt bizonyítják a következő állítások a magyar nyelvről: 1. Nemzeti kultúránk legfőbb hordozója; 2. A nemzet memóriarendszere; 3. Kollektív tudat; 4. Összetartó, nemzetmegtartó erő.

Nem véletlen, hogy magyar anyanyelvünkkel kapcsolatban képszerű metaforákkal élünk. Az anyanyelvünk lehet: édesanya (szeretni való, kedves, egyetlen); kincs (féltett, őrzendő); erős vár (összetartó erő, védelmet nyújtó közeg); kert (virul, de néha burjánzik, nyesegetni és ápolni kell); gépezet (működik, de kopik, romlik is).

Közismert tény, hogy a nyelv két nagy részből áll. Egyrészről „építőkockák” halmazából, amelyek a nyelv minden szintjén jelen vannak. Ezek a hangok, morfémák, szavak és szókapcsolatok. Másrészről a nyelv „építési szabályok” sorából áll, ez a nyelvtan, amely megmondja, hogy a gazdag építőelem-készletből miként rakhatjuk egymás mellé az építőelemeket.

Kétségtelen tény, hogy a nyelv építőkocka-készletének központi és legfontosabb eleme a szó. Nem véletlen, hogy maga a „szó” több mint kétszáz magyar szólásban szerepel. Pl. állja a szavát; szaván fogják; elakad a szava; egyik szavát a másikba ölti; szavahihető ember; szót fogad; szavakon lovagol; az utolsó szó jogán.

A TINTA Könyvkiadó épp ennek a központi nyelvi elemnek, a szónak leltározását, szótárakba foglalását tűzte ki célul és végzi következetesen több mint két évtizede. A kiadó szótárai szerkesztéséhez értelemszerűen kezdetektől számítógépet használ, és az utóbbi években jelentős anyagi és szellemi befektetéssel nagy szótáraiból létrehozta a SzóTudásTár online lexikai adatbázist.

A számítógépes lexikográfia és az elektronikus szótárak – visszatekintés

Váradi Tamás és J. M. Sinclair (1981) cikkének bevezetője nyomán az elektronikus szótárak típusainak és történetének összefoglalása:

  1. Fakszimileváltozat

Fakszimileváltozatnak az elektronikus szótáraknak azt a több évtizeddel ezelőtti változatát tekinthetjük, amikor a számítógépes alak grafikusan pontos tükörképe a nyomtatott oldalnak. A gép képként kezeli a szótár anyagát. Súlyos fogyatékossága ennek a megoldásnak, hogy keresni benne csak korlátozottan lehet, csupán lapozgatni lehet a képernyőn a szótárt, a gép csupán mint egy megjelenítő eszköz szerepel.

  1. Szöveghű változat

Ebben az esetben a szótárt betűről betűre hűen tartalmazza a számítógép. A szótár anyagát szövegként kezeli, igénybe vehetjük tehát a számítógépes programok keresőfunkcióját.

  1. Kódolt változat

A kódolt változat lényeges vonása, hogy a szótár formai s tartalmi jegyeit a szövegbe ültetett kódok explicit módon tartalmazzák. Évtizedes szabvány a szöveg tartalmi és formai kódolására a SGML, a Standard Generalized Markup Language (lásd 1. és 2. ábra). Lényege, hogy a megjelölt szövegrészt csúcsos zárójelkódok közé kell tenni, és a kódok írják le a tartalom mibenlétét.

  1. Adatbázis-változat

Mivel a szótárak általában szerkezetileg jól tagoltak, kézenfekvő így a szótárak anyagát adatbázisba szervezni. Az adatbázissá szervezett szótárban a megfelelő adatbázis-kezelő programmal kereshetünk. Ez azt jelenti, hogy a szótár nem egy hatalmas betűfolyam többé, hanem megfelelő keresőprogrammal összetett kereséseket is végezhetünk, megadhatjuk, hogy a szótár mely kategóriájában kívánunk keresni. Az egyik első projektet, amelynek keretében nyomtatott szótárt (Longman Dictionary of Contemporary English, LDOCE) számítógépes adatbázissá alakítottak, az Amszterdami Egyetem Angol Tanszékén végezték el.

A mára már kiteljesedett és megkerülhetetlen számítógépes lexikográfia az 1980-as években kezd önálló tudományággá válni – jegyzi meg Pajzs Júlia 1990-ben megjelent könyvében (Számítógépes lexikográfia). A számítógéppel segített szótár-előállításnak Pajzs Júlia 4 területét ismerteti: adatgyűjtés és rögzítés; lemmatizálás; konkordanciák készítése; szócikkírás. Kiegészíthetjük ezt a felsorolást azzal, hogy a számítógép kiválóan alkalmas a nyomtatott szótárak nyomdai előkészítésére. A Képes diákszótár számítógépes nyomdai előkészítő munkálatait ismerteti Kiss Gábor az 1992-ben megjelent tanulmányában (Computational Work on the Student’s Illustrated Dictionary of Hungarian and the Computational Study of its Vocabulary).

A kétezres évek elejétől széles körben elterjedt az internethasználat. Ezzel egyidejűleg a szótárak nagy része felkerült a világhálóra – szögezi le Prószéky Gábor (2011). Az addig papíralapú szótárakat megjelentető könyvkiadók új kihívással néztek szembe.

A SzóTudásTár létrehozója, a TINTA Könyvkiadó

A TINTA Könyvkiadó magyar tulajdonú, budapesti székhelyű szótár- és nyelvészeti szakkönyvkiadó. Évente 40-50 nyelvészeti szakkönyvet és 6-8 saját fejlesztésű magyar szótárt ad ki. Napjainkban a magyar egynyelvű szótárkiadás piacvezetője.

 

A SzóTudásTár felülete

A kiadó magas színvonalú munkásságát számos szakmai elismerés, kitüntetés bizonyítja: Budai Nagydíj, Könyvtárosok Fitz József-díja, Lőrincze Lajos-díj, MTA Kiváló Magyar Szótár díj, Pro Cultura díj, Szép Magyar Könyv oklevél.

A TINTA Könyvkiadó mélyen beágyazódott a magyar tudományos életbe. Több mint 2500 nyelvészt tudhat szerzőjének. Széles körű szakmai kapcsolati hálót épített ki az elmúlt két évtizedben. Többek között együttműködő szakmai partnerei: az Alkalmazott Nyelvészek és Nyelvtanárok Egyesülete (MANYE), az Anyanyelvápolók Szövetsége (ASZ), az ELTE BTK Mai Magyar Nyelvi Tanszéke, az Erdélyi Anyanyelvápolók Szövetsége, a Könyvtárosok Egyesülete, a Magyar Nyelvi Szolgáltató Iroda, a Modern Filológiai Társaság, az MTA Központi Hivatala, az MTA Nyelvtudományi Intézete (ma az ELKH Nyelvtudományi Kutatóközpontja), az MTA Nyelvtudományi Bizottságának Szótári Munkabizottsága, a Vajdasági Magyarok Szövetsége.

A TINTA Könyvkiadó szótárairól, nyelvészeti kiadványairól rendszeresen elismerő recenziót közölnek a szakfolyóiratok (Magyar Nyelv, Magyar Nyelvőr, Nyelvtudományi Közlemények, Modern Nyelvoktatás, Anyanyelv-pedagógia), és az új kiadványok megjelenéséről beszámolnak a magyarországi napilapok és hetilapok.

A TINTA Könyvkiadó szerzői, munkatársai a hazai nyelvészet elismert szakemberei, többen az MTA tagjai, illetve doktorai. A szerzők közül számosan az ELKH Nyelvtudományi Kutatóközpontjának munkatársai, illetve egyetemi tanszékek, kutatóhelyek vezetői.

A TINTA Könyvkiadó két honlapjáról (www.tinta.hu, www.tintakiado.hu) tájékozódhatnak az érdeklődők a kiadóban folyó kutatásokról, munkálatokról, eredményekről. A kiadó működteti és tölti fel rendszeresen tartalommal az Anya-nyelv-csavar blogot.

A TINTA Könyvkiadó nyelvészeti és szótársorozatai a következők: A magyar nyelv kézikönyvei (1–32); Segédkönyvek a nyelvészet tanulmányozáshoz (1–224); Az ékesszólás kiskönyvtára (1–85). A sorozatok folyamatosan újabb tagokkal bővülnek.

A TINTA Könyvkiadó jelentősebb egynyelvű nagyszótárai:

SzóTudásTár, a szótárak szótára, a lexikai alapú művelődéstörténeti és kultúrtörténeti tudástár

A SzóTudásTár létrehozását a TINTA Könyvkiadóban két évtized alatt összegyűlt és felhalmozott jelentős nyelvészeti, lexikográfiai, szótárírói tapasztalat tette lehetővé.

A SzóTudásTár a leggazdagabb tartalmú, interneten elérhető egynyelvű magyar szótár, mely a magyar szavakról a következő témakörökben ad információkat: helyesírás; értelmezés, jelentés; szinonima; eredet, etimológia; ellentét; szólás; közmondás; idegen szavak jelentése, eredete; régi szavak jelentése, eredete; kiejtés; összetett szavak; szólások, közmondások eredete.

A SzóTudásTárban elérhető 11, a témában piacvezető szótár tartalma és a nyomtatott szótárakból a bőség miatt kimaradt további szócikkek, összesen több mint 500 000 nyelvi adat, ezzel a leggazdagabb tartalmú magyar nyelvi tudástár.

A SzóTudásTár 11 nagyobb szótári adatbázisa és az egyes szótári adatbázisok címszavainak a száma:

  1. Értelmező szótár 15 853
  2. Etimológiai szótár 8 900
  3. Szinonimaszótár 25 796
  4. Ellentétszótár 13 636
  5. Régi szavak szótára 19 378
  6. Kiejtési szótár 30 922
  7. Összetett szavak 56 843
  8. Magyarító szótár 12 652
  9. Idegen szavak szótára 27 464
  10. Szólások, közmondások szótára 14 163
  11. Rövidítések szótára 12 074

A SzóTudásTár elérhetővé tehető bármely internetkapcsolattal rendelkező eszközön, számítógépen, tableten, okostelefonon.

A legmodernebb és elterjedt technológiák, informatikai megoldások kerültek felhasználásra a fejlesztés során (PHP, MySQL, AJAX, XML, JQuery, JSON, MooTools, HTML5).

A SzóTudásTár belső reprezentációja I.

SzóTudásTár belső reprezentációja II.

A SzóTudásTár alkalmas a kisiskolások internetes szótárhasználatra nevelésére, segítségével hiteles forrásból kereshetik ki azt, amit tudni szeretnének a magyar szavakról, ezzel fejlesztve nyelvi kifejező- és értelmezőkészségeiket. A szótárak, és ezen belül a szinonimaszótárak iskolai felhasználására Ruzsiczky Éva 1981-ben felhívta a figyelmet. Ruzsiczky Éva észrevételei természetszerűleg csak papíralapú szótárakra vonatkozhattak 1981-ben, napjainkban az elektronikus szótárak segítségével megtöbbszöröződtek a szótárak oktatásbeli felhasználásnak lehetőségei. A SzóTudásTárban a kötelező olvasmányok régies szavai mind megtalálhatók. Célközönség még a felsőbb fokon tanulókon túl az iskolát már elvégzett munkavállalók is, hogy például elkerülhessék a szóismétlést, vagy kikereshessék egy idegen szó jelentését. Mindezek mellett nagy segítség magyar nyelvet tanulók számára is.

A SzóTudásTárban minden egyéni és összesített keresés mérhető, elemezhető és felhasználható nyelvi-nyelvészeti kutatásokhoz, a nyelv változásának vizsgálatához.

A SzóTudásTár hiteles forrás és hivatkozási alap. Az interneten elérhető más szólisták, szótárak szerkesztői gyakran ismeretlenek, az adatok forrása általában nincs feltüntetve, hitelességük megkérdőjelezhető. Ezzel szemben a kiadónak dolgoznak a mai nyelvész-, szótárszerkesztő-társadalom legnagyobbjai. A keresett szó a „kalamitás”, begépelése során folyamatosan megjelennek az azonos kezdetű szavak

A SzóTudásTár keresőfelülete

A SzóTudásTárban a kalamitás szó találati listája

A SzóTudásTárban a sánta szó találati listája a szólások, közmondások adatbázisrészben

A SzóTudásTár oldal innovatív, folyamatosan bővül és fejlődik. A TINTA Könyvkiadó szerkesztői csapata folyamatosan fejleszti a szótárakat, készíti az új szócikkeket. Ennek módja többek között az új szavak, „divatszavak” keresése például újságokban, másrészt a szótárakban még nem szereplő szavak regisztrálása.

A kutya szó szócikkei különböző szótári adatbázisokban

Sok más országban a SzóTudásTárhoz hasonló tartalmú modern online egynyelvű szótárakat állami irányítással fejlesztik és szolgáltatják, költségvetési vagy európai uniós forrásból. Magyarországon ez nem történt meg, ezt pótolja a SzóTudásTár.

Az utóbbi év jelentős fejlesztésének eredményeképpen lehetőség nyílt arra, hogy a SzóTudásTár használói ne csak az adatbázist alkotó szócikkek címszavaira keressenek, hanem a szócikkek belsejében lévő szavakra is. Ezt a lehetőséget a keresőfelületen lévő kapcsoló beállításával lehet elérni.

A SzóTudásTár felhasználásának lehetséges célcsoportjai

Diákok: az anyanyelvi kompetencia fejlesztése, szókincsbővítés, az anyanyelvi ismeretek elmélyítése. Egyetemisták: lexikográfiai ismeretek elsajátítása, nyelvészeti diplomamunkák készítése. Kutatók, bármely tudományterületről: segítség a publikációk szakszerű megfogalmazásához. Nyelvészek: nyelvészeti tudástár, a kutatás segítése. Fordítók: szinonimaszótár, a megfelelő nyelvi forma megtalálása. Könyvtárosok: információnyújtás.

Összefoglalás

Meggyőződésünk, hogy Kosztolányi Dezső, aki a szótárakról az alábbi magasztos sorokat írta Szótárt lapozgatok című írásában, még nagyobb csodálkozásának adott volna hangot, ha használhatta volna a TINTA Könyvkiadó SzóTudásTárát:

„Szótárat lapozgatok. Van-e a szótárnál gazdagabb, élőbb, lelkesebb valami? Benne van nyelvünk összes szava. Benne van a virágok, ásványok, rovarok, háziállatok és fenevadak, a szerszámok, a közlekedési eszközök és fölszerelések, a fegyverek és hangszerek, a mesterségek, a testrészek és a nyavalyák neve. Benne van a gyöngédség és a durvaság minden árnyalata, az udvariasság és a gorombaság, a szemérem és a trágárság, a szépség és a rútság, az illat és a bűz, a tisztaság és a szutyok, a boldogság és a boldogtalanság, az önfeláldozás és a gyilkosság. Benne van a múltam, a jelenem és a jövendőm. Benne van az életem. Benne van a halálom is. Benne van a sorsom.”

Kiss Gábor

Irodalom

  • Kiss Gábor 1992. Computational Work on the Student’s Illustrated Dictionary of Hungarian and the Computational Study of its Vocabulary. In Ferenc Kiefer – Gábor Kiss – Júlia Pajzs (ed.): Papers in Computational Lexicography, COMPLEX 1992. Budapest: Linguistics Institute Hungarian Academy of Sciences.
  • Pajzs Júlia 1990. Számítógépes lexikográfia. (Linguistica – Series A – Studia et Dissertationes 4.) Budapest: A Magyar Tudományos Akadémia Nyelvtudományi Intézete.
  • Prószéky Gábor 2011. A szótári világ átalakulási tendenciái az internet megjelentével. Modern Nyelvoktatás. 2011/4: 3–13.
  • Ruzsiczky Éva 1981. A Magyar szinonimaszótár az iskolai nevelés szolgálatában. Magyar Nyelvőr. 105/3: 328–338.
  • Sinclair, J. M. 1987. Looking up: An Account if the COBOUILD Project in Lexical Computing. London: Collins.
  • Váradi Tamás 1991. A számítógépes lexikográfia új eszközeiről. In Hunyadi László et al. (szerk.): Könyv Papp Ferencnek. Tanulmánygyűjtemény Papp Ferenc születésnapjára. Debrecen, Kossuth Lajos Tudományegyetem. 367–374.

A TINTA Könyvkiadó most egyéni előfizetők számára is elérhetővé teszi a SzóTudásTárat. Az előfizetési díj egy évre 24.000 Ft, mely 2022. év karácsonyáig 50% kedvezménnyel bevezető áron 12.000 Ft. Kérjük, előfizetési szándékát a tintawebshop@gmail.com címen jelezze, érdeklődés a (1) 371 05 01 számon.