Latviešu valodas skaitļojamo leksisko resursu attīstīšana dabiskās valodas sapratnei un tekstradei

Gads 2023 Apr–2026 Mar
Finansējums Latvijas Zinātnes padome
Fundamentālo un lietišķo pētījumu projekti
lzp-2022/1-0443
Kopsavilkums Projekta mērķis ir attīstīt latviešu valodas skaitļojamos leksiskos resursus un valodas sapratnei un tekstradei nepieciešamos programmrīkus. Plānots paplašināt “Latviešu valodas leksisko tīklu” (Latvian WordNet) līdz plaša pārklājuma resursam, izveidot atvasinājumu un stabilu vārdu savienojumu semantikas sistēmu lielākajā atvērtajā latviešu valodas skaidrojošajā vārdnīcā Tezaurs.lv, kā arī izveidot skaitļojamu resursu daudzvalodu “Grammatical Framework” ietvarā. Izstrādāto skaitļojamo rersursu izmantošanas iespējas tiks demonstrētas ar lietojumpiemēru dabiskās valodas ģenerēšanā medicīnas nozarei. Valodnieciskā aspektā projekts iekļauj fundamentālu pētījumu par atvasinājumu semantiku un stabilu vārdu savienojumu struktūru un semantiku, savukārt datorlingvistiskā aspektā tiek attīstīta dabiskās valodas sapratne un ģenerēšana, izmantojot projekta gaitā izveidotos leksiskos resursus.

Publikācijas

M. Grasmanis, P. Paikens, L. Pretkalnina, L. Rituma, L. Strankale, A. Znotins, N. Gruzitis
Tēzaurs.lv – the experience of building a multifunctional lexical resource
Electronic lexicography in the 21st century (eLex 2023): Invisible Lexicography. Proceedings of the eLex 2023 conference, Lexical Computing CZ s.r.o., 2023
PDF, BibTeX