RHVoice, o sistema aberto de síntese de voz chega à versão 1.6.0

Faz pouco o lançamento da nova versão do sistema aberto de síntese de voz RHVoice 1.6.0 foi anunciado, que foi inicialmente desenvolvido para fornecer suporte de alta qualidade para o idioma russo, mas posteriormente adaptado para outros idiomas, incluindo inglês, português, ucraniano, quirguiz, tártaro e georgiano.

Para aqueles que não estão familiarizados com RHVoice, posso dizer que este projeto usa os desenvolvimentos do projeto HTS (Sistema de síntese de fala baseado em HMM / DNN) e um método de síntese paramétrica com modelos estatísticos (Síntese Paramétrica Estatística baseada em HMM - Hidden Markov Model).

As vantagens do modelo estatístico são baixos custos indiretos e baixa demanda de energia da CPU. Todas as operações são realizadas localmente no sistema do usuário. Três níveis de qualidade de voz são suportados (quanto menor a qualidade, maior o desempenho e menor o tempo de resposta).

A desvantagem do modelo estatístico é a qualidade relativamente baixa da pronúncia, que não atinge o nível dos sintetizadores que geram a fala a partir de uma combinação de fragmentos de fala naturais, mas mesmo assim o resultado é bastante legível e se assemelha a uma transmissão de um locutor. A título de comparação, o projeto Silero, que fornece um mecanismo aberto para síntese de fala baseado em tecnologias de aprendizado de máquina e um conjunto de modelos para a língua russa, é superior em qualidade ao RHVoice.

Existem 13 vozes disponíveis para o idioma russo e as vozes são formadas com base em gravações de voz naturais. Nas configurações, você pode alterar a velocidade, tom e volume.

A biblioteca Sonic pode ser usada para alterar o tempo. É possível detectar e alterar automaticamente o idioma com base na análise do texto de entrada (por exemplo, para palavras e citações em outro idioma, o modelo de síntese nativo do idioma fornecido pode ser usado). Perfis de voz são suportados, que definem combinações de voz para diferentes idiomas.

O código é escrito em C ++ e é distribuído sob a licença LGPL 2.1, além do sistema ser compatível com GNU / Linux, Windows e Android. O programa suporta interfaces TTS (text-to-speech) típicas para conversão de texto em fala: SAPI5 (Windows), Speech Dispatcher (GNU / Linux) e Android Text-To-Speech API, mas também pode ser usado na tela do NVDA.

RHVoice 1.6.0 Principais recursos novos

Nesta nova versão do sistema, destaca-se como principal novidade que 5 novas vozes são adicionadas para a língua russa, Além disso, o suporte para o idioma albanês foi implementado.

Outra mudança que se destaca nesta nova versão é que o dicionário foi atualizado para o idioma ucraniano e esse suporte foi expandido para expressar personagens emoji.

Também destaca o trabalho que se feito na correção de erros na aplicação da plataforma Android, A importação de dicionários personalizados foi simplificada e o suporte para a plataforma Android 11 foi adicionado.

Por outro lado, também podemos descobrir que novas configurações e funcionalidades foram adicionadas ao núcleo do motor, incluindo g2p.case, word_break e compatibilidade com filtros de equalização.

Por fim, se você tiver interesse em saber mais sobre esta nova versão, pode consultar os detalhes no link a seguir.

Baixar RHVoice

Paraaqueles que estão interessados ​​em poder baixar este sistema para síntese de voz, você pode obter os pacotes de instalação do link a seguir

Também é mencionado no anúncio desta nova versão que para usuários de Android que têm RHVoice já instalado no seu dispositivo, isso será atualizado automaticamente, se as atualizações automáticas estiverem habilitadas, não há necessidade de fazer o processo manualmente.

No caso de ter as atualizações desabilitadas e desejar ter a nova versão, pode ativar a função de verificação manual de atualizações.

Assim que o RHVoice atualizado for executado novamente, ele tentará fazer o download dos novos dados de idioma. Quando os novos dados forem baixados, o RHVoice começará a usá-los.