Valodu tehnoloģiju iniciatīva

Gads 2023 Jan–2026 Jūn
Finansējums ES Atveseļošanas un noturības mehānisms
Augsta līmeņa digitālo prasmju apguves nodrošināšana
2.3.1.1.i.0/1/22/I/CFLA/002
Partneri Latvijas Universitāte, LU Literatūras, folkloras un mākslas institūts, Rīgas Tehniskā universitāte, Rīgas Stradiņa universitāte, Tilde
Kopsavilkums Projektā tiek izstrādāti un pilnveidoti plaša lietojuma lielie valodas modeļi (LLM), gramatikas un leksikoni, tiek radītas tehnoloģijas monolingvālu un multilingvālu audiovizuālu datu apstrādei, kā arī tiek veidoti resursi un rīki, kas nodrošinās atbalstu valodu tehnoloģiju apguvei gan tehnoloģiju izstrādātājiem, gan lietotājiem. Tāpat plānots izveidot LLM trenēšanai nepieciešamo augstas veiktspējas skaitļošanas centru.

Publikācijas

R. Dargis, G. Barzdins, I. Skadina, N. Gruzitis, B. Saulite
Evaluating Open-Source LLMs in Low-Resource Languages: Insights from Latvian High School Exams
Proceedings of the 4th International Conference on Natural Language Processing for Digital Humanities, Association for Computational Linguistics, 2024
PDF, BibTeX
I. Skadina, J. Kuzmina, S. Kruks, M. Platonova, T. Smirnova, I. Auzina
Language Technology Initiative - Bridging the Gap between Research and Education
CLARIN Annual Conference Proceedings, 2024
PDF, BibTeX
P. Paikens, L. Pretkalnina, L. Rituma
A Computational Model of Latvian Morphology
Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING), 2024
PDF, BibTeX
R. Dargis, A. Znotins, I. Auzina, B. Saulite, S. Reinsone, R. Dejus, A. Klavinska, N. Gruzitis
BalsuTalka.lv – Boosting the Common Voice Corpus for Low-Resource Languages
Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING), 2024
PDF, BibTeX
R. Dargis and B. Saulite
Korpuss.lv – a Versatile Platform for Digital Humanities
Baltic Journal of Modern Computing, 12(4), 636-645, 2024
PDF, DOI, BibTeX
E. Mukans and G. Barzdins
RIGA at SemEval-2023 Task 2: NER Enhanced with GPT-3
17th International Workshop on Semantic Evaluation (SemEval), ACL, 2023
PDF, BibTeX
A. Branco, M. Eskevich, F. Frontini, J. Hajic, E. Hinrichs, F. de Jong, P. Kamocki, A. Konig, K. Linden, C. Navarretta et al.
The CLARIN Infrastructure as an Interoperable Language Technology Platform for SSH and Beyond
Language Resources and Evaluation, 2023
PDF, DOI, BibTeX