Laboratórium spracovania prirodzeného jazyka

Vedecké zameranie laboratória

NLP Lab FPVaI UKF v Nitre bolo založené v roku 2021 s cieľom vytvoriť priestor pre interdisciplinárny základný a aplikovaný výskum v oblasti spracovania prirodzeného jazyka a zároveň pomocou najmodernejšej infraštruktúry podporiť vzájomnú spoluprácu výskumníkov z Katedry informatiky s inými pracoviskami v rámci domácich a zahraničných inštitúcií.

NLP Lab realizuje výskum v oblasti spracovania prirodzeného jazyka a počítačovej lingvistiky. V súčasnosti sa rieši široká škála projektov zameraných hlavne na:

  • strojový preklad (MT), hodnotenie MT kvality a odhad MT kvality do slovenčiny,
  • získavanie znalostí zo štruktúrovaných a neštruktúrovaných dát,
  • metódy prípravy údajov pre klasifikáciu falošných správ zameraných na morfologickú a syntaktickú analýzu,
  • extrakciu znalostí z textov pre úlohy klasifikácie riešené pomocou neurónových sietí,
  • novú reprezentáciu slovných vektorov s využitím morfológie slovenského jazyka,
  • metódy Data Augmentation pre korpusy (pre LLM),
  • vytvorenie vhodnej architektúry pre spracovanie veľkých textových dát v štruktúrovanej podobe (formáte),
  • aplikáciu NLP metód pre včasnú detekciu Alzheimerovej choroby,
  • prediktívne modelovanie v oblasti trhovej disciplíny a finančnej výkonnosti.

V rámci NLP Lab pôsobia aj doktorandi programu Aplikovaná informatika, ktorých témy dizertačných prác korešpondujú s vedeckým zameraním laboratória.

NLP Lab intenzívne spolupracuje s jazykovými katedrami v rámci filozofických fakúlt na Slovensku napr. Univerzity Konštantína Filozofa v Nitre, Univerzity sv. Cyrila a Metoda v Trnave a Univerzity Komenského v Bratislave. NLP Lab nadviazalo spoluprácu s pracoviskami orientujúcimi sa na obdobnú oblasť výskumu, konkrétne s Ústavom českého jazyka na Masarykovej univerzite a s Centrom pre vedu a výskumu na Univerzite v Pardubiciach. 

Projekty

Vznik a následná činnosť NLP Labu bola a je podporená nasledovnými vedeckými projektami:

  • APVV-23-0554 - Predikcia kvality strojového prekladu do slovenčiny (2024-2026)
  • APVV-18-0473 - Klasifikačný model chybovosti strojového prekladu: krok k objektívnejšiemu hodnoteniu kvality prekladu (2019-2023)
  • VEGA 1/0792/21 - Komparatívna evalvácia strojového prekladu do slovenčiny: štatistický vs. neurónový strojový preklad (2021)
  • VEGA 1/0734/24 - Využívanie ESG informácií zverejňovaných komerčnými bankami v rámci Pilieru 3 (2024-2027)
  • VEGA 1/0821/21 - Pilier 3 - verifikácia účinnosti revízií zverejňovaných informácií komerčnými bankami v období očakávanej COVID-19 ekonomickej krízy (2021-2023)
  • OPVaI ITMS 313011T527 - Falošné informácie v prostredí Internetu - identifikácia, analýza obsahu, emócie (2020-2021)
  • GAČR - 22-22586S - Aspektově orientovaná analýza sentimentu finančních textů pro predikci finanční výkonnosti podniku (2022-2024)
  • GAČR - 19-15498S - Modelování emocí ve verbální a neverbální manažerské komunikaci pro predikci podnikových finančních rizik, (2019-2022)
  • COST Action - CA21167- Universality, diversity and idiosyncrasy in language technology (UniDive) (2023-2026)

Publikácie

  • Benko, L., Pilkova, A., Munk, M., Eley, S. (2024). Pillar 3: The impact of language complexity on the preferences of commercial bank website users. EXPERT SYSTEMS WITH APPLICATIONS, Elsevier, 125326.
    2023IF: 7.6, Q1 - JCR, Q1 - SJR
    https://doi.org/10.1016/j.eswa.2024.125326
  • Hajek, P., Munk, M. (2024). Corporate financial distress prediction using the risk-related information content of annual reports. INFORMATION PROCESSING & MANAGEMENT, Elsevier, 61(5), 103820.
    2023IF: 7.4, Q1 - JCR, Q1 - SJR
    https://doi.org/10.1016/j.ipm.2024.103820
  • Benko, L., Munkova, D., Munk, M., Benkova, L., Hajek, P. (2024). The use of residual analysis to improve the error rate accuracy of machine translation. SCIENTIFIC REPORTS, Nature, 14, 9293.
    2023IF: 3.8, Q1 - JCR, Q1 - SJR
    https://doi.org/10.1038/s41598-024-59524-3
  • Benko, L., Munkova, D., Pappova, M., Munk, M. (2024). Comparison of various approaches to tagging for the inflectional Slovak language. PEERJ COMPUTER SCIENCE, PEERJ, 10(1), e2026.
    2023IF: 3.5, Q1 - JCR, Q1 - SJR
    http://doi.org/10.7717/peerj-cs.2026
  • Kapusta, J., Drzik, D., Steflovic, K., Szabo Nagy, K. (2024). Text Data Augmentation Techniques for Word Embeddings in Fake News Classification. IEEE ACCESS, IEEE, 12, 31538-31550.
    2023IF: 3.4, Q2 - JCR, Q1 - SJR
    https://doi.org/10.1109/ACCESS.2024.3369918
  • Halvonik, D., Kapusta, J. (2024). Large Language Models and Rule-Based Approaches in Domain-Specific Communication. IEEE ACCESS, IEEE, 12, 107046-107058.
    2023IF: 3.4, Q2 - JCR, Q1 - SJR
    https://doi.org/10.1109/ACCESS.2024.3436902
  • Munkova, D., Stranovska, E., Munk, M. (2024). Communication models in a foreign language in relation to cognitive style category width and power distance, FRONTIERS IN PSYCHOLOGY, Frontiers, 14.
    2023IF: 2.6, Q2 - JCR, Q2 - SJR
    https://doi.org/10.3389/fpsyg.2023.1272370
  • Reichel, J., Benko, L. (2024). Preservation of sentiment in machine translation of low-resource languages: a case study on Slovak movie subtitles. LANGUAGE RESOURCES AND EVALUATION, Springer.
    2023IF: 2.0, Q3 - JCR, Q1 - SJR
    https://doi.org/10.1007/s10579-024-09736-w
  • Hudecová, E., Stahl, J., Benkova, L., Munkova, D. (2024). Qualität des Posteditierens von maschinell erstellten Übersetzungen technischer Texte aus dem Slowakischen ins Deutsche durch erstsprachig slowakische Posteditoren. ZEITSCHRIFT FÜR SLAWISTIK, 69(1), 27-49. 2023IF: 0.2
    https://doi.org/10.1515/slaw-2024-0002
  • Boltiziar, J., Munkova, D. (2023). Emergency remote teaching of listening comprehension using YouTube videos with captions. EDUCATION AND INFORMATION TECHNOLOGIES, Springer. 2023IF: 4.8, Q1 - JCR, Q1 - SJR
    https://doi.org/10.1007/s10639-023-12282-7
  • Hajek, P., Munk, M. (2023). Speech emotion recognition and text sentiment analysis for financial distress prediction. NEURAL COMPUTING & APPLICATIONS, Springer, 35(29), 21463-21477.
    2023IF: 4.5, Q2 - JCR, Q1 - SJR
    https://doi.org/10.1007/s00521-023-08470-8
  • Nagy, K.S., Kapusta, J., Munk, M. (2023). Feature extraction from unstructured texts as a combination of the morphological and the syntactic analysis and its usage in fake news classification tasks. NEURAL COMPUTING & APPLICATIONS, Springer, 35(29), 22055-22067.
    2023IF: 4.5, Q2 - JCR, Q1 - SJR
    https://doi.org/10.1007/s00521-023-08967-2
  • Forgac, F., Munkova, D., Munk, M., Kelebercova, L. (2023). Evaluating automatic sentence alignment approaches on English-Slovak sentences. SCIENTIFIC REPORTS, Nature, 13(1), 20123.
    2023IF: 3.8, Q1 - JCR, Q1 - SJR
    https://doi.org/10.1038/s41598-023-47479-w
  • Halvonik, D., Kapusta, J., Munk, M. (2023). Improve estimated time-on-task calculation in a Virtual Learning Environment. INTERACTIVE LEARNING ENVIRONMENTS, Routledge, 31(5), 2914-2929.
    2023IF: 3.7, Q1 - JCR, Q1 - SJR
    https://doi.org/10.1080/10494820.2021.1913609
  • Munkova, D., Panisova, L., Welnitzova, K. (2023). A human evaluation of English-Slovak machine translation. PERSPECTIVES - STUDIES IN TRANSLATION THEORY AND PRACTICE, Routledge, 31(6), 1142-1161.
    2023IF: 1, Q2 - JCR, Q1 - SJR
    https://doi.org/10.1080/0907676X.2022.2116989
  • Stahl, J., Munkova, D., Benko, L., Hudecova, E. (2023). Maschinelle, posteditierte und menschliche Übersetzung publizistischer und populärwissenschaftlicher Texte aus dem Slowakischen ins Deutsche. LEBENDE SPRACHEN, De Gruyter, 68(2), 259-282.
    2023: Q3 - SJR
    https://doi.org/10.1515/les-2022-1039
  • Wrede, O., Munkova, D., Banik, T., Munk, M. (2022). Zur Erforschung von Korrelationen zwischen verschiedenen Fehlertypen bei der maschinellen Übersetzung aus dem Deutschen ins Slowakische. LEBENDE SPRACHEN, De Gruyter, 67(2), 432-456.
    2022: Q2 - SJR
    https://doi.org/10.1515/les-2022-1032
  • Munk, M., Pilkova, A., Benko, L., Blazekova, P., Svec, P. (2021). Web usage analysis of Pillar 3 disclosed information by deposit customers in turbulent times. EXPERT SYSTEMS WITH APPLICATIONS, Elsevier, 185, 115503.
    2021IF: 8.665, Q1 - JCR, Q1 - SJR
    https://doi.org/10.1016/j.eswa.2021.115503
  • Hajek, P., Barushka, A., Munk, M. (2021). Neural Networks with Emotion Associations, Topic Modeling and Supervised Term Weighting for Sentiment Analysis. INTERNATIONAL JOURNAL OF NEURAL SYSTEMS, World Scientific, 31(10), 2150013.
    2021IF: 6.325, Q1 - JCR, Q1 - SJR
    https://doi.org/10.1142/S0129065721500131
  • Nagy, K., Kapusta, J. (2021). Improving fake news classification using dependency grammar. PLOS ONE, Public Library of Science, 16(9), e0256940.
    2021IF: 3.752, Q2 - JCR, Q1 - SJR
    https://doi.org/10.1371/journal.pone.0256940
  • Pilkova, A., Munk, M., Benko, L., Blazekova, P., Kapusta, J. (2021). Pillar 3: Does banking regulation support stakeholders' interest in banks financial and risk profile? PLOS ONE, Public Library of Science, 16(10), e0258449.
    2021IF: 3.752, Q2 - JCR, Q1 - SJR
    https://doi.org/10.1371/journal.pone.0258449
  • Munkova, D., Munk, M., Benko, L., Hajek, P. (2021). The role of automated evaluation techniques in online professional translator training. PEERJ COMPUTER SCIENCE, PeerJ, 7, e706.
    2021IF: 2.411, Q2 - JCR, Q2 - SJR
    https://doi.org/10.7717/peerj-cs.706
  • Kapusta, J., Drlik, M., Munk, M. (2021). Using of N-grams From Morphological Tags for Fake News Classification. PEERJ COMPUTER SCIENCE, PeerJ, 7, e624.
    2021IF: 2.411, Q2 - JCR, Q2 - SJR
    https://doi.org/10.7717/peerj-cs.624
  • Kapusta, J., Benko, L., Munkova, D., Munk, M. (2021). Analysis of Edit Operations for Post-editing Systems. INTERNATIONAL JOURNAL OF COMPUTATIONAL INTELLIGENCE SYSTEMS, Springer, 14(1), 197.
    2021IF: 2.259, Q3 - JCR, Q2 - SJR
    https://doi.org/10.1007/s44196-021-00048-3
  • Munkova, D., Munk, M., Benko, L., Stastny, J. (2021). MT evaluation in the context of language complexity. COMPLEXITY, Wiley-Hindawi, 2021, 2806108.
    2021IF: 2.121, Q2 - JCR, Q1 - SJR
    https://doi.org/10.1155/2021/2806108
  • Munkova, D., Munk, M., Welnitzova, K., Jakabovicova, J. (2021). Product and process analysis of machine translation into the inflectional language. SAGE OPEN, Sage, 11(4), 21582440211054501.
    2021IF: 2.032, Q2 - JCR, Q2 - SJR
    https://doi.org/10.1177/21582440211054501

Spolupráca s akadémiou a praxou

NLP Lab intenzívne spolupracuje s jazykovými katedrami v rámci filozofických fakúlt na Slovensku napr. Univerzity Konštantína Filozofa v Nitre, Univerzity sv. Cyrila a Metoda v Trnave a Univerzity Komenského v Bratislave.
NLP Lab nadviazalo spoluprácu s pracoviskami orientujúcimi sa na obdobnú oblasť výskumu, konkrétne s Centrom pre vedu a výskumu Univerzity Pardubice, PLIN na Masarykovej univerzite, Fakultou informatiky a managementu Univerzity Hradec Králové, Univerzitou v Ľubľane, Lorraine Research Laboratory in Computer Science and its Applications, Kyrgyz State Technical University a inými.

Slovenská spoločnosť prekladateľov odbornej literatúry (projekty APVV)
Axon Pro, spol. s r.o. (projekt EWA)
Všeobecná úverová banka, a.s. (projekty VEGA)

V rámci NLP Lab pôsobia aj doktorandi programu Aplikovaná informatika, ktorých témy dizertačných prác korešpondujú s vedeckým zameraním laboratória.

Ponuka analýz pre komerčnú i nekomerčnú prax

NLP Lab disponuje potrebným hardvérovým a softvérovým vybavením a poskytuje dostatočnú výpočtovú kapacitu pre spracovanie veľkého objemu štruktúrovaných a neštruktúrovaných dát. V rámci vybavenia je to profesionálny data miningový nástroj Statistica Data Miner a IBM Modeler a výpočtový server pre projekty PhD. študentov (Jupyter + Python lib.).

Vedúca laboratória

prof. RNDr. Daša Munková, PhD.
Katedra informatiky
Fakulta prírodných vied a informatiky UKF v Nitre
Tr. A. Hlinku 1
949 01 Nitra
tel. 037 6408 722
e-mail: dmunkova@ukf.sk

Image
Image

Táto webová stránka používa cookies.

Pokračovaním v prehliadaní si tejto webovej stránky bez zmeny nastavenia vášho webového prehliadača pre súbory cookie súhlasíte s používaním cookies. Dozvedieť sa viac

Rozumiem

V týchto zásadách používame výraz "cookies" ako odkaz na súbory cookies a iné podobné technológie, na ktoré sa vzťahuje smernica EÚ o ochrane súkromia v elektronických komunikáciách.

Čo je cookie?

Cookies sú malé textové súbory vytvorené navštívenou webovou stránkou obsahujúce údaje. Ukladajú sa do počítača návštevníka, aby umožnili užívateľovi prístup k rôznym funkciám. Na našich stránkach sa spolu so súbormi cookie relácií používajú aj iné trvalé súbory cookies. Súbory cookie relácie sú dočasne uložené v pamäti počítača, pokiaľ si návštevník prehliada webové stránky. Tieto súbory cookie sa vymažú, keď užívateľ zatvorí webový prehliadač alebo po uplynutí určitej doby (čo znamená, že relácia vyprší). Trvalé súbory cookie zostávajú v počítači návštevníka až do ich vymazania.

Prečo používame cookies?

Súbory cookies používame na to, aby sme sa dozvedeli viac o tom, ako návštevníci komunikujú s našim obsahom a pomáhajú nám zlepšiť zážitok pri návšteve našich webových stránok.

Funkčnosť a obsah stránky

Funkciu zdieľania používajú návštevníci, aby odporučili naše stránky a obsah na sociálnych sieťach, ako je Facebook a Twitter. Súbory cookie ukladajú informácie o tom, ako návštevníci používajú funkciu zdieľania, i keď nie individuálnej úrovni, aby bolo možné danú webovú stránku zlepšiť. Ak neprijmete súbory cookies, neuložia sa žiadne informácie. Na niektoré ďalšie funkcie na našich webových stránkach používame tretie strany, napríklad ak navštívite stránky s vloženými videami z YouTube alebo stránky, ktoré obsahujú odkazy na YouTube. Tieto videá alebo odkazy (a iný obsah od tretích strán) môžu obsahovať súbory cookies tretích strán a možno že si budete chcieť pozrieť zásady webových stránok týchto tretích strán ohľadne informácií týkajúcich ich používania súborov cookies.

Analytika webovej stránky

Táto webová stránka používa Google Analytics, ktorá používa súbory cookies. Vo všeobecnosti súbory cookies ukladajú informácie o tom, ako návštevníci používajú webové stránky, vrátane počtu zobrazených stránok, odkiaľ návštevníci pochádzajú a počet návštev za účelom zlepšenia webovej stránky a poskytnutia užívateľom dobré skúsenosti. Ak neprijmete súbory cookies, neuložia sa žiadne informácie.

Ako odmietnem a vymažem cookies?

Súbory cookies nepoužijeme na zhromažďovanie identifikovateľných informácií o návštevníkovi. Avšak v prípade, že tak budete chcieť urobiť, môžete si vybrať a odmietnuť alebo zablokovať cookies, ktoré nastavila spoločnosť Electrolux alebo webové stránky tretích strán tým, že zmeníte nastavenia vášho prehliadača. Ohľadne ďalších podrobností pozri „funkcia pomoc“. Vezmite na vedomie, že väčšina prehliadačov automaticky akceptuje cookies, takže ak si neprajete používať cookies, bude potrebné ich aktívne vymazať alebo zablokovať. Informácie o používaní cookies v prehliadačoch v mobilných telefónoch a podrobnosti, ako odmietnuť alebo vymazať takéto cookies, nájdete v príručke vášho mobilného telefónu. Majte na pamäti, že ak odmietne používanie cookies, naše stránky budete môcť navštíviť, avšak niektoré funkcie nemusia fungovať správne.