免费POC, 零成本试错
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


我要投稿

Qwen3-TTS全面升级:声情并茂,语通八方

发布日期:2025-12-11 09:12:35 浏览次数: 1570
作者:通义千问Qwen

微信搜一搜,关注“通义千问Qwen”

推荐语

Qwen3-TTS带来49种生动音色与10大语言支持,让语音合成更富情感与地域特色。

核心内容:
1. 多音色选择:覆盖不同性别、年龄与角色设定
2. 多语种方言:支持10种主流语言及8种中国方言
3. 拟人化升级:自适应语速与韵律逼近真人表现

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家


Qwen3-TTS 是支持多音色、多语种和多方言的旗舰语音合成模型,致力于实现稳定、自然和高效的语音生成,目前可通过Qwen API访问。


要改进:

  • 更加丰富的音色支持:Qwen3-TTS 提供超过49种高品质音色,涵盖不同性别、年龄、地域特征与角色设定,满足多样化的场景需求。撒娇搞怪-茉兔,陪伴感满满的青梅竹马-小野杏,傲娇率性的女汉子-十三 ,严厉老师-墨讲师 ,智慧老者-沧明子,萝莉萌妹-萌小姬等众多角色等你探索。

  • 多语种多方言能力持续增强:Qwen3-TTS 支持中文、英文、德语、意大利语、葡萄牙语、西班牙语、日语、韩语、法语、俄语等10大主流语言,在MiniMax TTS multilingual test set上,平均词错误率(WER)优于MiniMax、ElevenLabs及GPT-4o-Audio-Preview。支持更多音色的方言生成,包括普通话、闽南语、吴语、粤语、四川话、北京话、南京话、天津话和陕西话,真实还原地方口音特色与语言神韵。

  • 韵律/语速更加自然,更拟人化:相比于上一个版本,Qwen3-TTS自适应根据文本调节语速和韵律的能力大幅提高,拟人化程度逼近真人。


    Qwen3-TTS API文档

    https://help.aliyun.com/zh/model-studio/multi-round-conversation?spm=a2c4g.11186623.help-menu-2400256.d_0_1_1.49445002U6gJoz



 展示样例


Qwen3-TTS 提供了个性鲜明、情感饱满的多元声音形象供用户选择,可满足多样化的场景需求。以下是一些合成样音:



音色:田叔    Vincent

语言:中文

文本1:话说这长安秋夜,诸位听好了!天边残星闪烁,雁阵南归,高楼之上,笛声悠扬,哀婉如泣。紫菊半开,红莲凋落,渔舟鲈鱼鲜美,却无人归。霜露渐浓,南冠楚囚之故事,仿佛重现啊!


音色:邻家妹妹    Nini

语言:中文

文本2:哥哥你怎么了呀?看你从刚才就没怎么说话,眉头还皱着,是不是遇到啥烦心事了?要是工作上不顺心跟我说说呗,就算我帮不上大忙,听你念叨念叨也能舒服点呀。


音色:卡捷琳娜    Katerina

语言:英文

文本3:Hello! How are you today? I'm doing great, thank you! Hi everyone! My name is Katerina, and I'm thrilled to be here today. By day, I’m an actor, but when I’m not performing, you’ll find me exploring new hobbies—like travel ,though I once accidentally booked a one-way ticket to Iceland... but hey, the Northern Lights were worth it!


Qwen3-TTS 深度支持多种汉语方言表达,精准还原口音语调与地域韵味。以下是一些合成样音:


音色:老李 Li

语言:中文

方言:南京话

文本4:哎——你搞什么鬼啊?骑个车横冲直撞的!眼珠子长后脑勺上啦?再这么骑,老子把你车子掀翻掉!真当老子脾气好是不是?!


音色:Roy

语言:中文

方言:闽南语

文本5:唉哟,阿嬷,今仔日涨工啦,水电、肥料拢涨,我哪敢乱开价?


音色:Kiki

语言:中文

方言:粤语

文本6:今晚打邊爐好唔好啊?突然间好想食肥牛同埋響鈴卷啊!打边炉最开心就係一班人围埋一齐慢慢倾慢慢食。你仲想加啲咩料落去?我就想食鱼皮饺同埋墨鱼丸啦,仲可以饮埋冻柠茶,爽呀!不如我哋顺便去买埋啲蔬菜,芋头、金针菇都唔错喎,咁先齐全啊嘛


Qwen3-TTS 同样支持了地道自然的多语种音色,发声习惯更贴近母语表达。以下是一些合成样例:


音色:Lenn

语言:德语

文本7:Kannst du bitte die Musik leiser stellen? Ich kann mich nicht konzentrieren.


音色:Dolce

语言:意大利语

文本8:Ciao, bellissima! Hai quel look che mi fa girare la testa—sempre impeccabile. Stasera c’è un nuovo lounge in centro… ci vai con me? Prometto: niente di noioso, solo stile e buona musica.


音色:Ono Anna

语言:日语

文本9:えー、困るね…。今日、絶対遅刻したくないのに。でもタクシーって高いし、混んでそうじゃない?どうしよう、もうちょっと様子見た方がいいかな。でも、間に合わなかったら最悪だし…。あー、やっぱり電車って信用できない時あるよね。○○ちゃんはどうする?一緒にタクシー乗る?


音色:Sohee

语言:韩语

文本9:안녕하세요! 오늘 날씨 진짜 좋네요~ ☀️ 방금 길에서 강아지 봤는데 너무 귀여워서 사진 찍었어요! 혹시 커피 한 잔 할래요? 제가 살게요—오늘 기분이 완전 최고라서! 😊



 模型性能




 使用方法

通过 Qwen API 使用 Qwen3-TTS 是非常简单的,我们在下面提供了一个简单的代码片段以供体验:


# 请安装 DashScope SDK 的最新版本import osimport requestsimport dashscopetext = "那我来给大家推荐一款T恤,这款呢真的是超级好看,这个颜色呢很显气质,而且呢也是搭配的绝佳单品,大家可以闭眼入,真的是非常好看,对身材的包容性也很好,不管啥身材的宝宝呢,穿上去都是很好看的。推荐宝宝们下单哦。"# SpeechSynthesizer接口使用方法:dashscope.audio.qwen_tts.SpeechSynthesizer.call(...)response = dashscope.MultiModalConversation.call(    model="qwen3-tts-flash-2025-11-27",    api_key=os.getenv("DASHSCOPE_API_KEY"),    text=text,    voice="Cherry",    language_type="Chinese", # 建议与文本语种一致,以获得正确的发音和自然的语调。    stream=False)audio_url = response.output.audio.urlsave_path = "downloaded_audio.wav"  # 自定义保存路径try:    response = requests.get(audio_url)    response.raise_for_status()  # 检查请求是否成功    withopen(save_path, 'wb') as f:        f.write(response.content)    print(f"音频文件已保存至:{save_path}")except Exception as e:    print(f"下载失败:{str(e)}")

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询