english  norsk  česky 

rozšířené vyhledávání
na_celou_sirku
Foto: beey.io
Upozornění na článek Tisknout Zmenšit písmo Zvětšit písmo

Díky spolupráci českých a norských vědců se česká webová aplikace na přepis mluveného slova “naučila” norštinu

Vědci z Technické univerzity v Liberci (TUL), výzkumníci z Norwegian University of Science and Technology v Trondheimu (NTNU) a tým pražské společnosti NEWTON Technologies společně úspěšně dokončili výzkumný projekt NORDTRANS. V jeho rámci vyvinuli vysoce přesný algoritmus pro automatické rozpoznávání mluvené norštiny a švédštiny za účelem převedení na text. Výsledky této unikátní spolupráce může nyní využít česká webová aplikace Beey, která umí převést mluvené slovo na text již v téměř 20 světových jazycích.

Česká společnost NEWTON Technologies (zal. 2008) tuto stále populárnější službu vyvinula již před několika lety, ovšem ze začátku se specializovala pouze na slovanské jazyky (čeština, slovenština, polština, chorvatština). Program se mezi uživateli těchto jazyků rychle osvědčil – jeho editované titulky používají například české televize DVTV, Nova nebo Prima. Společnost NEWTON Technologies se proto rozhodla rozšířit své portfolio na germánské jazyky. Nabídnout mezi nimi i norštinu by však nebylo možné bez již zmíněného úsilí českých a norských vědců – ti výsledky své práce představili na společné tiskové konferenci konané dne 24. listopadu 2022.

Pro přepis norštiny vědci použili novou generaci systémů rozpoznávání řeči, tzv. end-to-end rozpoznávač, který se skládá z jedné mohutné neuronové sítě. Tato umělá inteligence se pomocí algoritmů strojového učení natrénuje na požadovaný jazyk, k čemuž je potřeba hlavně obrovské množství dat, konkrétně zvukové nahrávky a jejich doslovný přepis. Při dostatečném množství kvalitních dat se pak tato verze rozpoznávače je schopna naučit velmi přesnému přepisu audiozáznamu na text - běžně dosahuje přesnosti nad 90 %. V automatickém přepisu pak mohou uživatelé dále provádět změny k dosažení 100% přesnosti, dělit text dle jednotlivých mluvčích, strukturovat podle témat a provádět mnoho dalších úprav. Navíc v Beey zůstane u každého slova uložená časová značka propojená na audio stopu, a to umožňuje přehrávat zvuk i podle umístění kurzoru v textu.

Díky rozšiřující se nabídce jazyků může aplikace zajistit klientům ve stále více zemích inovativní řešení pro diktování, automatický přepis nahrávek a jeho efektivní editaci. Program je vhodný pro novináře, videoproducenty, přednášející, zapisovatele a další širokou škálu uživatelů, kteří využívají ve své práci přepisy textů, editaci, titulkování nebo překlady. Časová úspora při použití aplikace Beey je velmi významná.

"Nová end-to-end technologie rozpoznávání řeči dosahuje mnohem lepších výsledků, než na které jsme byli dosud zvyklí. Přesnost přepisu je v mnoha případech neuvěřitelně vysoká“, uvádí́ hlavní řešitelka projektu, Lenka Weingartová z české IT firmy NEWTON Technologies, a dodává: „Doposud jsme se soustředili zejména na slovanské jazyky, tento projekt byl naším prvním výletem do severní Evropy. Spolupráce s NTNU nám otevírá mnoho možností dostat se na tyto rozvinuté trhy.

Projekt NORDTRANS byl finančně podpořen grantem ve výši 1,24 mil. EUR z prostředků Norských fondů a TAČR.

Autorka: Edita Gabrielová, stážistka ZÚ Oslo

Nordtrans

Nordtrans

Beey - podporované jazyky

Beey - podporované jazyky