TecheNet
  • Mobile
    • APPLE
    • APPS
    • GOOGLE
    • HUAWEI
    • ONEPLUS
    • SAMSUNG
    • XIAOMI
  • Tech
    • AUTOMÓVEIS
    • MOBILIDADE ELÉTRICA
    • IMAGEM & SOM
    • ENTREVISTAS
  • Gaming
  • IA
  • Opinião
  • Segurança
  • Negócios
    • EMPRESAS
    • CRIPTOMOEDAS
    • MARKETING
  • Mais
    • ARTE E CULTURA
    • DICAS
    • LIFESTYLE
    • DIREITOS COM CAUSA
    • INTERNET
    • GUIAS
    • PROMOÇÕES
    • REVIEWS
    • SUSTENTABILIDADE
    • TUTORIAIS
Sem resultados
Ver todos os resultados
TecheNet
Sem resultados
Ver todos os resultados

Microsoft lança VibeVoice-1.5B, modelo TTS de código aberto

Alfredo Beleza por Alfredo Beleza
27/08/2025
Em Microsoft

A Microsoft lançou o Microsoft VibeVoice-1.5B, um novo modelo de conversão de texto em voz (Text-to-Speech, TTS) de grande escala e código aberto.

Disponibilizado para a comunidade de investigação, o modelo destaca-se pela sua capacidade de gerar áudio de longa duração e diálogos com múltiplos intervenientes, o que representa um avanço considerável na síntese de voz.

Microsoft lança vibevoice-1. 5b, modelo tts de código aberto

Capacidades de geração e especificações

O VibeVoice-1.5B introduz várias funcionalidades notáveis para a síntese de voz:

  • Geração de Áudio Longo: O modelo pode gerar até 90 minutos de áudio contínuo numa única inferência, superando as limitações de sistemas anteriores focados em frases curtas.
  • Diálogo Multi-Interveniente: Suporta a síntese de conversas com até quatro oradores distintos, mantendo a consistência vocal de cada um ao longo da geração.
  • Eficiência Computacional: Utiliza tokenizers (acústico e semântico) que operam a uma frequência ultra-baixa de 7.5 Hz, permitindo um processamento eficiente de sequências longas.

Arquitetura do modelo e licenciamento

A arquitetura do VibeVoice-1.5B é composta por três componentes principais:

  1. Large Language Model (LLM): Utiliza o Qwen2.5-1.5B para a compreensão do contexto textual e da estrutura do diálogo.
  2. Tokenizers (Acústico e Semântico): Responsáveis por converter o texto em representações que o modelo consegue processar.
  3. Diffusion Head: Um módulo que gera os detalhes acústicos de alta fidelidade da voz.

A Microsoft disponibilizou o modelo de código aberto sob a licença MIT, permitindo o seu uso em projetos de investigação. Os pesos do modelo e a documentação estão acessíveis na plataforma Hugging Face.

Limitações e utilização recomendada

A documentação oficial especifica as seguintes limitações de utilização para a versão atual:

  • Suporte de Idiomas: O modelo foi treinado primariamente em inglês e chinês, não sendo recomendado para outros idiomas.
  • Capacidades de Áudio: A geração está limitada a voz humana, não incluindo música, efeitos sonoros ou sobreposição de falas.
  • Uso Proibido: A sua utilização para clonagem ou imitação de voz sem consentimento explícito é estritamente proibida. O modelo herda ainda os enviesamentos do LLM base.

O uso recomendado pela Microsoft é, para já, estritamente para fins de investigação e desenvolvimento.

Conclusão

O lançamento do VibeVoice-1.5B pela Microsoft constitui um contributo significativo para a comunidade de investigação em IA de texto-para-voz. As suas capacidades de geração de áudio longo e diálogos complexos, aliadas à sua arquitetura eficiente e licenciamento de código aberto, fornecem uma nova e poderosa ferramenta para o avanço da tecnologia de síntese de voz.

Outros artigos interessantes:

  • Católica Porto Business School lança Pós-Graduação em IA
  • Identificada campanha de phishing via Google Classroom
  • Plataforma TechEU: novo apoio do BEI para start-ups
PartilhaTweetEnvia
Alfredo Beleza

Alfredo Beleza

Gestor de empresas, “blogger” e designer. Com uma carreira marcada por experiências internacionais, foi diretor de marketing/comercial em empresas na Suiça e no Brasil. É co-fundador do site de notícias TecheNet, onde partilha a sua paixão pelo mundo da tecnologia.

Artigos relacionados

Windows astra conceito - windows mobile
Mobile

O maior erro da Microsoft? Novo conceito ‘Windows Astra’ prova que o Windows Phone faria sucesso

15/11/2025
Windows 11 comando xbox
Gaming

A próxima Xbox será um PC com Windows 11, dizem fontes internas

28/10/2025
Xbox
Microsoft

Xbox: o rival já não é a Sony, mas sim o TikTok e os filmes

27/10/2025
Microsoft copilot gaming (3)
Microsoft

Microsoft jura: o Copilot não está a espiar os teus jogos (será?)

26/10/2025
Microsoft rejeita conteúdo adulto e demarca-se da openai
Inteligência Artificial

Microsoft rejeita conteúdo adulto e demarca-se da OpenAI

25/10/2025
Microsoft copilot mico
Microsoft

Microsoft Mico: a IA do Copilot ganhou uma cara (e emoções)

24/10/2025

Últimas notícias

Deepseek ai

DeepSeek volta a atacar: novos modelos desafiam o GPT-5 e o Gemini 3 com “eficiência”

04/12/2025
Capcom resident evil requiem

Resident Evil Requiem: gameplay de combate revelado na TV japonesa

04/12/2025
Metroid prime 4

Metroid Prime 4 chegou: a despedida perfeita para a era da Nintendo Switch

04/12/2025
QNAP

Salários de 5.000€: a armadilha da Dark Web para jovens

Google Photos ganha retoque facial: mudar dentes e olhos chega em breve

QNAP e V-Valley Portugal assinam acordo para o mercado Enterprise

Honor quebra o silêncio: “Nenhum smartwatch mede a temperatura do corpo com precisão”

Amazfit T-Rex 3 Pro recebe atualização: BioCharge e navegação renovados

iPhone 17e: o modelo ‘barato’ ganha Ilha Dinâmica e ecrã OLED

Cloudflare trava o maior ataque DDoS da história da Internet

Samsung marca encontro para 4 de janeiro: IA e o TriFold global abrem a CES 2026

Infinix Note 60 Ultra: o primeiro ‘smartphone’ desenhado pela lendária Pininfarina

Google Discover usa IA para reescrever títulos e o resultado é desastroso

Motorola Edge 70 Ultra: imagens revelam novo design e um botão misterioso para IA

nubia Flip3 oficial: ecrã exterior gigante num dobrável que quer ser acessível

Android 16 devolve funcionalidade aos Google Pixel: desbloqueio com ecrã desligado

Samsung confirma Exynos 2600 com vídeo ao estilo ‘Stranger Things’

Huawei destrona Apple na China: vendas de tablets disparam e iPad entra em queda livre

QNAP lança QuTS hero h6.0 Beta com foco em IA local e alta disponibilidade

Samsung garante metade dos chips de memória da próxima geração da Nvidia

Techenet LOGO
  • Quem somos
  • Fale connosco, envie a sua pergunta aqui
  • Termos e condições
  • Política de comentários
  • Política de Privacidade
  • Política de Cookies
Sem resultados
Ver todos os resultados
  • Mobile
    • APPLE
    • APPS
    • GOOGLE
    • HUAWEI
    • ONEPLUS
    • SAMSUNG
    • XIAOMI
  • Tech
    • AUTOMÓVEIS
    • MOBILIDADE ELÉTRICA
    • IMAGEM & SOM
    • ENTREVISTAS
  • Gaming
  • IA
  • Opinião
  • Segurança
  • Negócios
    • EMPRESAS
    • CRIPTOMOEDAS
    • MARKETING
  • Mais
    • ARTE E CULTURA
    • DICAS
    • LIFESTYLE
    • DIREITOS COM CAUSA
    • INTERNET
    • GUIAS
    • PROMOÇÕES
    • REVIEWS
    • SUSTENTABILIDADE
    • TUTORIAIS

© 2025 JNews - Premium WordPress news & magazine theme by Jegtheme.