Tags

Notícias

Nova ferramenta do Google permite converter textos em até 32 vozes

28 março, 2018
Da Redação, com assessoria

O Text-to-Speech é a mais nova ferramenta do Google Cloud. Ela permite a conversão de fala em texto em mais de 32 vozes em 12 idiomas diferentes, inclusive português. É a primeira vez que a empresa disponibiliza o WaveNet, um produto de pesquisa de síntese de voz da DeepMind, para o público.

“Muitos produtos do Google como, por exemplo, o Google Assistant, Search e Maps, vêm com uma síntese de texto para fala incorporada, de alta qualidade, que produz fala com som natural”, afirma o gerente de produtos de Google Cloud AI Dan Aharon. “Os desenvolvedores nos disseram que gostariam de adicionar texto para voz a seus próprios aplicativos. Por isso, hoje estamos trazendo essa tecnologia para o Google Cloud Platform, com o Cloud Text-to-Speech”.

Personalização

A novidade também traz pronúncias mais assertivas em  textos complexos, como nomes, datas, horários e endereços. O produto já é utilizado por empresas como Cisco e Dolphin ONE, e permite diversas personalizações. O tom, a taxa de fala e o ganho de volume da voz podem ser alterados. Além disso, a ferramenta oferece suporte a diversos formatos de áudio, incluindo MP3 e WAV.

Com o Cloud Text-to-Speech é possível selecionar vozes de alta fidelidade. Elas foram construídas com base no WaveNet, um modelo generativo para áudio bruto criado pela DeepMind.


Na galeria, veja todos os eletrônicos testados pelo 33Giga.

Newsletter

Receba com exclusividade nossos conteúdos e o e-book sobre segurança na internet.