Spravodajský portál Tlačovej agentúry Slovenskej republiky
Štvrtok 26. marec 2026Meniny má Emanuel
< sekcia UNESCO a veda

Vedci vytvorili jazykový AI model trénovaný pre potreby slovenčiny

Na archívnej snímke vstup do areálu Slovenskej akadémie vied v Bratislave. Foto: TASR - Dano Veselský

Jazykové modely predstavujú základ moderných nástrojov umelej inteligencie (AI), ktoré dokážu pracovať s textom podobne ako človek.

Bratislava 26. marca (TASR) - Tím slovenských vedcov vytvoril inštrukčný jazykový model cielene trénovaný pre potreby slovenského jazyka. Tento model podľa jedného z jeho autorov, Mareka Dobeša zo Slovenskej akadémie vied (SAV), umožňuje posilniť technologickú autonómiu krajiny a zároveň zachovať jej kultúrnu identitu v digitálnom svete.

Model Qwen3-14B-SK vznikol úpravou parametrov multilingválneho modelu, ktorý vedci kompletne doladili pomocou rozsiahlych slovenských jazykových dát. „Významnou súčasťou projektu bolo aj technické zabezpečenie tréningu modelu. Ten prebiehal na výkonných európskych superpočítačoch Leonardo a Perun,“ doplnil Dobeš. Na vývoji modelu sa okrem neho podieľali aj Peter Bednár z Technickej univerzity v Košiciach a Radovan Garabík z Jazykovedného ústavu Ľ. Štúra SAV.

Jazykové modely predstavujú základ moderných nástrojov umelej inteligencie (AI), ktoré dokážu pracovať s textom podobne ako človek. „V praxi sa využívajú pri automatickom preklade, tvorbe textov, sumarizácii informácií, vyhľadávaní odpovedí, ale aj v medicíne či vzdelávaní. Pomáhajú zrýchľovať prácu, sprístupňovať informácie a zjednodušovať komunikáciu v digitálnom prostredí,“ spresnil Dobeš.

Globálne jazykové modely podľa jeho slov často nedostatočne zachytávajú špecifiká menších jazykov. „Nedostatok sa prejavuje najmä pri témach úzko spätých so slovenským prostredím - históriou, spoločenskými reáliami, regionálnymi výrazmi alebo odbornou terminológiou," ozrejmil. Aj preto považuje vývoj domáceho riešenia za dôležitý krok k posilneniu technologickej a jazykovej autonómie Slovenska.

„Modely trénované na kvalitných slovenských dátach dokážu lepšie rozumieť kontextu, rešpektovať jazykové normy a poskytovať presnejšie a prirodzenejšie odpovede pre používateľov na Slovensku,“ podotkol s tým, že model z dielne slovenských vedcov je verejne dostupný pre ďalší výskum aj praktické využitie.