Polski syntezator mowy najlepszy na świecie
Polski syntezator mowy ludzkiej IVONA
został uznany za najlepszy na świecie. Zwycięstwo Polaków w
międzynarodowym konkursie Blizzard Chalenge ogłoszono na
konferencji Interspeech 2006 w Pittsburghu (USA) - poinformował Łukasz Osowski, współautor technologii.
25.09.2006 16:40
Program komputerowy, opracowany przez Łukasza Osowskiego i Michała Kaszczuka, pozwala osobom niewidomym pracować przy komputerze i korzystać z informacji umieszczonych w Internecie. Obaj laureaci są absolwentami Politechniki Gdańskiej.
IVONA to swoisty silnik, który pozwala odczytywać teksty zapisane w formie cyfrowej- tłumaczył Osowski. Jak wyjaśnił, o sukcesie IVONY zadecydowała konsekwencja jej twórców w dążeniu do tego, aby "sztuczna mowa" brzmiała możliwie najbardziej naturalnie, a więc aby jakość głosu była jak najlepsza.
Na silniku IVONA oparto już kilka produktów, które znalazły zastosowanie komercyjne. Syntezator wykorzystywany jest nie tylko przez osoby niewidome i niedowidzące; stosuje go także wojsko i firmy telekomunikacyjne - do automatycznego odczytywania tekstów przez telefon. Popularna wersja syntezatora, Ekspressivo, umożliwia odsłuchiwanie poczty elektronicznej i dokumentów podczas jazdy samochodem lub spaceru, a także zapisywanie wiadomości w postaci plików mp3.
Jednym z ciekawszych zastosowań IVONY jest wbudowanie jej w serwisy internetowe, dzięki czemu ich czytelnicy nie męczą wzroku. Popularne portale już stosują tę technologię - zapewnia Osowski. Na zakup syntezatora mowy IVONA Osobom niewidomym i niedowidzącym Państwowy Fundusz Rehabilitacji Osób Niepełnosprawnych (PFRON) udziela dofinansowania. Technologia ta posiada także rekomendację ministerstwa edukacji. Koszt urządzenia to około 600 zł.
Polskie prace nad syntezatorem mowy trwały około trzech lat. IVONA powstała w Pomorskim Parku Naukowo-Technologicznym w Gdyni, gdzie Osowski i Kaszczuk, tuż po obronie prac magisterskich, założyli firmę spinn-off IVO Software. Działalność w obszarze parku pozwoliła firmie na szybki rozwój. Mieliśmy niski czynsz, pomoc prawną, księgową i organizacyjną, dysponowaliśmy doskonałymi łączami internetowymi. Prestiż Parku zwiększył też skuteczność działań marketingowych - podkreślił Osowski.
Do tej pory technologia dostosowana była do potrzeb rynku polskiego. Na potrzeby konkursu informatycy opracowali angielską wersję programu.
Konkurs Blizzard Challenge jest organizowany przez Carnegie Mellon University z USA. Brało w nim udział 14 grup badawczych z całego świata. Wśród uczestników konkursu jest siedem ośrodków naukowych oraz siedem ośrodków badawczo-rozwojowych firm, zajmujących się syntezą mowy - z Japonii, USA, Wielkiej Brytanii, Niemiec, Izraela i Chin.