Vedecké zameranie laboratória
NLP Lab FPVaI UKF v Nitre bolo založené v roku 2021 s cieľom vytvoriť priestor pre interdisciplinárny základný a aplikovaný výskum v oblasti spracovania prirodzeného jazyka a zároveň pomocou najmodernejšej infraštruktúry podporiť vzájomnú spoluprácu výskumníkov z Katedry informatiky s inými pracoviskami v rámci domácich a zahraničných inštitúcií.
NLP Lab realizuje výskum v oblasti spracovania prirodzeného jazyka a počítačovej lingvistiky. V súčasnosti sa rieši široká škála projektov zameraných hlavne na:
- strojový preklad (MT), hodnotenie MT kvality a odhad MT kvality do slovenčiny,
- získavanie znalostí zo štruktúrovaných a neštruktúrovaných dát,
- metódy prípravy údajov pre klasifikáciu falošných správ zameraných na morfologickú a syntaktickú analýzu,
- extrakciu znalostí z textov pre úlohy klasifikácie riešené pomocou neurónových sietí,
- novú reprezentáciu slovných vektorov s využitím morfológie slovenského jazyka,
- metódy Data Augmentation pre korpusy (pre LLM),
- vytvorenie vhodnej architektúry pre spracovanie veľkých textových dát v štruktúrovanej podobe (formáte),
- aplikáciu NLP metód pre včasnú detekciu Alzheimerovej choroby,
- prediktívne modelovanie v oblasti trhovej disciplíny a finančnej výkonnosti.
V rámci NLP Lab pôsobia aj doktorandi programu Aplikovaná informatika, ktorých témy dizertačných prác korešpondujú s vedeckým zameraním laboratória.
NLP Lab intenzívne spolupracuje s jazykovými katedrami v rámci filozofických fakúlt na Slovensku napr. Univerzity Konštantína Filozofa v Nitre, Univerzity sv. Cyrila a Metoda v Trnave a Univerzity Komenského v Bratislave. NLP Lab nadviazalo spoluprácu s pracoviskami orientujúcimi sa na obdobnú oblasť výskumu, konkrétne s Ústavom českého jazyka na Masarykovej univerzite a s Centrom pre vedu a výskumu na Univerzite v Pardubiciach.
Projekty
Vznik a následná činnosť NLP Labu bola a je podporená nasledovnými vedeckými projektami:
- APVV-23-0554 - Predikcia kvality strojového prekladu do slovenčiny (2024-2026)
- APVV-18-0473 - Klasifikačný model chybovosti strojového prekladu: krok k objektívnejšiemu hodnoteniu kvality prekladu (2019-2023)
- VEGA 1/0792/21 - Komparatívna evalvácia strojového prekladu do slovenčiny: štatistický vs. neurónový strojový preklad (2021)
- VEGA 1/0734/24 - Využívanie ESG informácií zverejňovaných komerčnými bankami v rámci Pilieru 3 (2024-2027)
- VEGA 1/0821/21 - Pilier 3 - verifikácia účinnosti revízií zverejňovaných informácií komerčnými bankami v období očakávanej COVID-19 ekonomickej krízy (2021-2023)
- OPVaI ITMS 313011T527 - Falošné informácie v prostredí Internetu - identifikácia, analýza obsahu, emócie (2020-2021)
- GAČR - 22-22586S - Aspektově orientovaná analýza sentimentu finančních textů pro predikci finanční výkonnosti podniku (2022-2024)
- GAČR - 19-15498S - Modelování emocí ve verbální a neverbální manažerské komunikaci pro predikci podnikových finančních rizik, (2019-2022)
- COST Action - CA21167- Universality, diversity and idiosyncrasy in language technology (UniDive) (2023-2026)
Publikácie
- Benko, L., Pilkova, A., Munk, M., Eley, S. (2024). Pillar 3: The impact of language complexity on the preferences of commercial bank website users. EXPERT SYSTEMS WITH APPLICATIONS, Elsevier, 125326.
2023IF: 7.6, Q1 - JCR, Q1 - SJR
https://doi.org/10.1016/j.eswa.2024.125326 - Hajek, P., Munk, M. (2024). Corporate financial distress prediction using the risk-related information content of annual reports. INFORMATION PROCESSING & MANAGEMENT, Elsevier, 61(5), 103820.
2023IF: 7.4, Q1 - JCR, Q1 - SJR
https://doi.org/10.1016/j.ipm.2024.103820 - Benko, L., Munkova, D., Munk, M., Benkova, L., Hajek, P. (2024). The use of residual analysis to improve the error rate accuracy of machine translation. SCIENTIFIC REPORTS, Nature, 14, 9293.
2023IF: 3.8, Q1 - JCR, Q1 - SJR
https://doi.org/10.1038/s41598-024-59524-3 - Benko, L., Munkova, D., Pappova, M., Munk, M. (2024). Comparison of various approaches to tagging for the inflectional Slovak language. PEERJ COMPUTER SCIENCE, PEERJ, 10(1), e2026.
2023IF: 3.5, Q1 - JCR, Q1 - SJR
http://doi.org/10.7717/peerj-cs.2026 - Kapusta, J., Drzik, D., Steflovic, K., Szabo Nagy, K. (2024). Text Data Augmentation Techniques for Word Embeddings in Fake News Classification. IEEE ACCESS, IEEE, 12, 31538-31550.
2023IF: 3.4, Q2 - JCR, Q1 - SJR
https://doi.org/10.1109/ACCESS.2024.3369918 - Halvonik, D., Kapusta, J. (2024). Large Language Models and Rule-Based Approaches in Domain-Specific Communication. IEEE ACCESS, IEEE, 12, 107046-107058.
2023IF: 3.4, Q2 - JCR, Q1 - SJR
https://doi.org/10.1109/ACCESS.2024.3436902 - Munkova, D., Stranovska, E., Munk, M. (2024). Communication models in a foreign language in relation to cognitive style category width and power distance, FRONTIERS IN PSYCHOLOGY, Frontiers, 14.
2023IF: 2.6, Q2 - JCR, Q2 - SJR
https://doi.org/10.3389/fpsyg.2023.1272370 - Reichel, J., Benko, L. (2024). Preservation of sentiment in machine translation of low-resource languages: a case study on Slovak movie subtitles. LANGUAGE RESOURCES AND EVALUATION, Springer.
2023IF: 2.0, Q3 - JCR, Q1 - SJR
https://doi.org/10.1007/s10579-024-09736-w - Hudecová, E., Stahl, J., Benkova, L., Munkova, D. (2024). Qualität des Posteditierens von maschinell erstellten Übersetzungen technischer Texte aus dem Slowakischen ins Deutsche durch erstsprachig slowakische Posteditoren. ZEITSCHRIFT FÜR SLAWISTIK, 69(1), 27-49. 2023IF: 0.2
https://doi.org/10.1515/slaw-2024-0002 - Boltiziar, J., Munkova, D. (2023). Emergency remote teaching of listening comprehension using YouTube videos with captions. EDUCATION AND INFORMATION TECHNOLOGIES, Springer. 2023IF: 4.8, Q1 - JCR, Q1 - SJR
https://doi.org/10.1007/s10639-023-12282-7 - Hajek, P., Munk, M. (2023). Speech emotion recognition and text sentiment analysis for financial distress prediction. NEURAL COMPUTING & APPLICATIONS, Springer, 35(29), 21463-21477.
2023IF: 4.5, Q2 - JCR, Q1 - SJR
https://doi.org/10.1007/s00521-023-08470-8 - Nagy, K.S., Kapusta, J., Munk, M. (2023). Feature extraction from unstructured texts as a combination of the morphological and the syntactic analysis and its usage in fake news classification tasks. NEURAL COMPUTING & APPLICATIONS, Springer, 35(29), 22055-22067.
2023IF: 4.5, Q2 - JCR, Q1 - SJR
https://doi.org/10.1007/s00521-023-08967-2 - Forgac, F., Munkova, D., Munk, M., Kelebercova, L. (2023). Evaluating automatic sentence alignment approaches on English-Slovak sentences. SCIENTIFIC REPORTS, Nature, 13(1), 20123.
2023IF: 3.8, Q1 - JCR, Q1 - SJR
https://doi.org/10.1038/s41598-023-47479-w - Halvonik, D., Kapusta, J., Munk, M. (2023). Improve estimated time-on-task calculation in a Virtual Learning Environment. INTERACTIVE LEARNING ENVIRONMENTS, Routledge, 31(5), 2914-2929.
2023IF: 3.7, Q1 - JCR, Q1 - SJR
https://doi.org/10.1080/10494820.2021.1913609 - Munkova, D., Panisova, L., Welnitzova, K. (2023). A human evaluation of English-Slovak machine translation. PERSPECTIVES - STUDIES IN TRANSLATION THEORY AND PRACTICE, Routledge, 31(6), 1142-1161.
2023IF: 1, Q2 - JCR, Q1 - SJR
https://doi.org/10.1080/0907676X.2022.2116989 - Stahl, J., Munkova, D., Benko, L., Hudecova, E. (2023). Maschinelle, posteditierte und menschliche Übersetzung publizistischer und populärwissenschaftlicher Texte aus dem Slowakischen ins Deutsche. LEBENDE SPRACHEN, De Gruyter, 68(2), 259-282.
2023: Q3 - SJR
https://doi.org/10.1515/les-2022-1039 - Wrede, O., Munkova, D., Banik, T., Munk, M. (2022). Zur Erforschung von Korrelationen zwischen verschiedenen Fehlertypen bei der maschinellen Übersetzung aus dem Deutschen ins Slowakische. LEBENDE SPRACHEN, De Gruyter, 67(2), 432-456.
2022: Q2 - SJR
https://doi.org/10.1515/les-2022-1032 - Munk, M., Pilkova, A., Benko, L., Blazekova, P., Svec, P. (2021). Web usage analysis of Pillar 3 disclosed information by deposit customers in turbulent times. EXPERT SYSTEMS WITH APPLICATIONS, Elsevier, 185, 115503.
2021IF: 8.665, Q1 - JCR, Q1 - SJR
https://doi.org/10.1016/j.eswa.2021.115503 - Hajek, P., Barushka, A., Munk, M. (2021). Neural Networks with Emotion Associations, Topic Modeling and Supervised Term Weighting for Sentiment Analysis. INTERNATIONAL JOURNAL OF NEURAL SYSTEMS, World Scientific, 31(10), 2150013.
2021IF: 6.325, Q1 - JCR, Q1 - SJR
https://doi.org/10.1142/S0129065721500131 - Nagy, K., Kapusta, J. (2021). Improving fake news classification using dependency grammar. PLOS ONE, Public Library of Science, 16(9), e0256940.
2021IF: 3.752, Q2 - JCR, Q1 - SJR
https://doi.org/10.1371/journal.pone.0256940 - Pilkova, A., Munk, M., Benko, L., Blazekova, P., Kapusta, J. (2021). Pillar 3: Does banking regulation support stakeholders' interest in banks financial and risk profile? PLOS ONE, Public Library of Science, 16(10), e0258449.
2021IF: 3.752, Q2 - JCR, Q1 - SJR
https://doi.org/10.1371/journal.pone.0258449 - Munkova, D., Munk, M., Benko, L., Hajek, P. (2021). The role of automated evaluation techniques in online professional translator training. PEERJ COMPUTER SCIENCE, PeerJ, 7, e706.
2021IF: 2.411, Q2 - JCR, Q2 - SJR
https://doi.org/10.7717/peerj-cs.706 - Kapusta, J., Drlik, M., Munk, M. (2021). Using of N-grams From Morphological Tags for Fake News Classification. PEERJ COMPUTER SCIENCE, PeerJ, 7, e624.
2021IF: 2.411, Q2 - JCR, Q2 - SJR
https://doi.org/10.7717/peerj-cs.624 - Kapusta, J., Benko, L., Munkova, D., Munk, M. (2021). Analysis of Edit Operations for Post-editing Systems. INTERNATIONAL JOURNAL OF COMPUTATIONAL INTELLIGENCE SYSTEMS, Springer, 14(1), 197.
2021IF: 2.259, Q3 - JCR, Q2 - SJR
https://doi.org/10.1007/s44196-021-00048-3 - Munkova, D., Munk, M., Benko, L., Stastny, J. (2021). MT evaluation in the context of language complexity. COMPLEXITY, Wiley-Hindawi, 2021, 2806108.
2021IF: 2.121, Q2 - JCR, Q1 - SJR
https://doi.org/10.1155/2021/2806108 - Munkova, D., Munk, M., Welnitzova, K., Jakabovicova, J. (2021). Product and process analysis of machine translation into the inflectional language. SAGE OPEN, Sage, 11(4), 21582440211054501.
2021IF: 2.032, Q2 - JCR, Q2 - SJR
https://doi.org/10.1177/21582440211054501
Spolupráca s akadémiou a praxou
NLP Lab intenzívne spolupracuje s jazykovými katedrami v rámci filozofických fakúlt na Slovensku napr. Univerzity Konštantína Filozofa v Nitre, Univerzity sv. Cyrila a Metoda v Trnave a Univerzity Komenského v Bratislave.
NLP Lab nadviazalo spoluprácu s pracoviskami orientujúcimi sa na obdobnú oblasť výskumu, konkrétne s Centrom pre vedu a výskumu Univerzity Pardubice, PLIN na Masarykovej univerzite, Fakultou informatiky a managementu Univerzity Hradec Králové, Univerzitou v Ľubľane, Lorraine Research Laboratory in Computer Science and its Applications, Kyrgyz State Technical University a inými.
Slovenská spoločnosť prekladateľov odbornej literatúry (projekty APVV)
Axon Pro, spol. s r.o. (projekt EWA)
Všeobecná úverová banka, a.s. (projekty VEGA)
V rámci NLP Lab pôsobia aj doktorandi programu Aplikovaná informatika, ktorých témy dizertačných prác korešpondujú s vedeckým zameraním laboratória.
Ponuka analýz pre komerčnú i nekomerčnú prax
NLP Lab disponuje potrebným hardvérovým a softvérovým vybavením a poskytuje dostatočnú výpočtovú kapacitu pre spracovanie veľkého objemu štruktúrovaných a neštruktúrovaných dát. V rámci vybavenia je to profesionálny data miningový nástroj Statistica Data Miner a IBM Modeler a výpočtový server pre projekty PhD. študentov (Jupyter + Python lib.).
Vedúca laboratória
prof. RNDr. Daša Munková, PhD.
Katedra informatiky
Fakulta prírodných vied a informatiky UKF v Nitre
Tr. A. Hlinku 1
949 01 Nitra
tel. 037 6408 722
e-mail: dmunkova@ukf.sk