菜单
你还未登录

Mistral发布新开源语音生成模型 支持多语言与实时性能

TechCrunch · AI科技 · 原文时间:2026-03-26 11:30:00 · 抓取:2026-03-26 18:10:15
综合评分 0/100 信号强度 0/100 相关性 0/100 可信度 0/100
摘要 / 我的正文
法国AI公司Mistral于周四发布了一款新的开源文本转语音模型Voxtral TTS,可用于语音AI助手及企业客户支持等场景,使其与ElevenLabs、Deepgram、OpenAI等公司形成直接竞争。该模型支持英语、法语、德语、西班牙语、荷兰语、葡萄牙语、意大利语、印地语和阿拉伯语共九种语言。Mistral AI科学运营副总裁Pierre Stock在电话采访中表示,客户对语音模型有需求,因此公司开发了这款小型化模型,可适配智能手表、智能手机、笔记本电脑等边缘设备,成本仅为市场同类产品的一小部分,但性能达到行业领先水平。该模型基于Ministral 3B构建,能通过不足五秒的语音样本适配自定义声音,捕捉细微口音、语调、抑扬顿挫及语音流中的不规则特征,且可在不同语言间切换时保持声音特性,适用于配音或实时翻译等场景,旨在让声音听起来更自然而非机械。据介绍,模型针对实时性能设计,在处理500字符、10秒样本时,首音频输出时间(TTFA)为90毫秒,实时因子(RTF)为6倍,即渲染10秒音频仅需约1.6秒。今年早些时候,Mistral已推出两款转录模型,分别用于大批量处理和低延迟实时场景,此次新语音模型的发布或旨在为企业提供全套语音产品。Stock称公司计划打造端到端平台,处理音频、文本、图像等多模态输入输出,端到端智能体系统能通过音频输入输出获取更多信息。Mistral的定位是,其开源特性和可定制化优势将帮助企业选择其语音模型,因为企业可按自身需求进行调整。
关键要点
一句话结论
(可由AI生成:一句话讲清这条新闻对你意味着什么)
可借鉴点
(可由AI生成:这条新闻能迁移到哪些业务/审查/写作场景)
证据锚点
(如:判决法院/案号/专利号/关键时间点)
后续跟踪
(如:上诉进展/和解条款/监管动作/同类案件)
证据与引用
原文链接:https://techcrunch.com/2026/03/26/mistral-releases-a-new-open-source-model-for-speech-generation/
来源:TechCrunch
原文时间:2026-03-26 11:30:00 抓取:2026-03-26 18:10:15
知识面板
分类
AI科技
来源
TechCrunch
原文时间
2026-03-26 11:30:00
抓取时间
2026-03-26 18:10:15

综合评分
0/100
信号强度
0/100
相关性
0/100
影响度
0/100
可信度
0/100