微信扫码
添加专属顾问
我要投稿
Qwen3-TTS带来49种生动音色与10大语言支持,让语音合成更富情感与地域特色。 核心内容: 1. 多音色选择:覆盖不同性别、年龄与角色设定 2. 多语种方言:支持10种主流语言及8种中国方言 3. 拟人化升级:自适应语速与韵律逼近真人表现
Qwen3-TTS 是支持多音色、多语种和多方言的旗舰语音合成模型,致力于实现稳定、自然和高效的语音生成,目前可通过Qwen API访问。
主要改进:
更加丰富的音色支持:Qwen3-TTS 提供超过49种高品质音色,涵盖不同性别、年龄、地域特征与角色设定,满足多样化的场景需求。撒娇搞怪-茉兔,陪伴感满满的青梅竹马-小野杏,傲娇率性的女汉子-十三 ,严厉老师-墨讲师 ,智慧老者-沧明子,萝莉萌妹-萌小姬等众多角色等你探索。
多语种多方言能力持续增强:Qwen3-TTS 支持中文、英文、德语、意大利语、葡萄牙语、西班牙语、日语、韩语、法语、俄语等10大主流语言,在MiniMax TTS multilingual test set上,平均词错误率(WER)优于MiniMax、ElevenLabs及GPT-4o-Audio-Preview。支持更多音色的方言生成,包括普通话、闽南语、吴语、粤语、四川话、北京话、南京话、天津话和陕西话,真实还原地方口音特色与语言神韵。
韵律/语速更加自然,更拟人化:相比于上一个版本,Qwen3-TTS自适应根据文本调节语速和韵律的能力大幅提高,拟人化程度逼近真人。
Qwen3-TTS API文档:
https://help.aliyun.com/zh/model-studio/multi-round-conversation?spm=a2c4g.11186623.help-menu-2400256.d_0_1_1.49445002U6gJoz
展示样例
Qwen3-TTS 提供了个性鲜明、情感饱满的多元声音形象供用户选择,可满足多样化的场景需求。以下是一些合成样音:
音色:田叔 Vincent
语言:中文
文本1:话说这长安秋夜,诸位听好了!天边残星闪烁,雁阵南归,高楼之上,笛声悠扬,哀婉如泣。紫菊半开,红莲凋落,渔舟鲈鱼鲜美,却无人归。霜露渐浓,南冠楚囚之故事,仿佛重现啊!
音色:邻家妹妹 Nini
语言:中文
文本2:哥哥你怎么了呀?看你从刚才就没怎么说话,眉头还皱着,是不是遇到啥烦心事了?要是工作上不顺心跟我说说呗,就算我帮不上大忙,听你念叨念叨也能舒服点呀。
音色:卡捷琳娜 Katerina
语言:英文
文本3:Hello! How are you today? I'm doing great, thank you! Hi everyone! My name is Katerina, and I'm thrilled to be here today. By day, I’m an actor, but when I’m not performing, you’ll find me exploring new hobbies—like travel ,though I once accidentally booked a one-way ticket to Iceland... but hey, the Northern Lights were worth it!
Qwen3-TTS 深度支持多种汉语方言表达,精准还原口音语调与地域韵味。以下是一些合成样音:
音色:老李 Li
语言:中文
方言:南京话
文本4:哎——你搞什么鬼啊?骑个车横冲直撞的!眼珠子长后脑勺上啦?再这么骑,老子把你车子掀翻掉!真当老子脾气好是不是?!
音色:Roy
语言:中文
方言:闽南语
文本5:唉哟,阿嬷,今仔日涨工啦,水电、肥料拢涨,我哪敢乱开价?
音色:Kiki
语言:中文
方言:粤语
文本6:今晚打邊爐好唔好啊?突然间好想食肥牛同埋響鈴卷啊!打边炉最开心就係一班人围埋一齐慢慢倾慢慢食。你仲想加啲咩料落去?我就想食鱼皮饺同埋墨鱼丸啦,仲可以饮埋冻柠茶,爽呀!不如我哋顺便去买埋啲蔬菜,芋头、金针菇都唔错喎,咁先齐全啊嘛
Qwen3-TTS 同样支持了地道自然的多语种音色,发声习惯更贴近母语表达。以下是一些合成样例:
音色:Lenn
语言:德语
文本7:Kannst du bitte die Musik leiser stellen? Ich kann mich nicht konzentrieren.
音色:Dolce
语言:意大利语
文本8:Ciao, bellissima! Hai quel look che mi fa girare la testa—sempre impeccabile. Stasera c’è un nuovo lounge in centro… ci vai con me? Prometto: niente di noioso, solo stile e buona musica.
音色:Ono Anna
语言:日语
文本9:えー、困るね…。今日、絶対遅刻したくないのに。でもタクシーって高いし、混んでそうじゃない?どうしよう、もうちょっと様子見た方がいいかな。でも、間に合わなかったら最悪だし…。あー、やっぱり電車って信用できない時あるよね。○○ちゃんはどうする?一緒にタクシー乗る?
音色:Sohee
语言:韩语
文本9:안녕하세요! 오늘 날씨 진짜 좋네요~ ☀️ 방금 길에서 강아지 봤는데 너무 귀여워서 사진 찍었어요! 혹시 커피 한 잔 할래요? 제가 살게요—오늘 기분이 완전 최고라서! 😊
模型性能
使用方法
通过 Qwen API 使用 Qwen3-TTS 是非常简单的,我们在下面提供了一个简单的代码片段以供体验:
# 请安装 DashScope SDK 的最新版本import osimport requestsimport dashscopetext = "那我来给大家推荐一款T恤,这款呢真的是超级好看,这个颜色呢很显气质,而且呢也是搭配的绝佳单品,大家可以闭眼入,真的是非常好看,对身材的包容性也很好,不管啥身材的宝宝呢,穿上去都是很好看的。推荐宝宝们下单哦。"# SpeechSynthesizer接口使用方法:dashscope.audio.qwen_tts.SpeechSynthesizer.call(...)response = dashscope.MultiModalConversation.call( model="qwen3-tts-flash-2025-11-27", api_key=os.getenv("DASHSCOPE_API_KEY"), text=text, voice="Cherry", language_type="Chinese", # 建议与文本语种一致,以获得正确的发音和自然的语调。 stream=False)audio_url = response.output.audio.urlsave_path = "downloaded_audio.wav" # 自定义保存路径try: response = requests.get(audio_url) response.raise_for_status() # 检查请求是否成功 withopen(save_path, 'wb') as f: f.write(response.content) print(f"音频文件已保存至:{save_path}")except Exception as e: print(f"下载失败:{str(e)}")53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2025-12-11
Qwen3-Omni新升级:声形意合,令出智随!
2025-12-11
首发实测智谱 GLM-TTS:3秒克隆我的声音,连「哎等等这bug怎么回事」都学会了
2025-12-11
硅基流动上线智谱视觉模型 GLM-4.6V
2025-12-11
GLM-TTS技术报告:基于多奖励强化学习的可控发音语音合成
2025-12-09
Ming-Flash-Omni 音视图文全模态技术报告解读 —— 一为全,全为一
2025-12-07
阿里 Qwen3-TTS 全新上线!支持9种方言+49种音色,连天津味儿都拿捏了!
2025-12-06
微软又上大分!刚刚开源一款 0.5B 轻量级实时 TTS 模型,还能边想边说!
2025-12-03
Step-Audio-R1 技术报告解析
2025-09-19
2025-11-10
2025-10-22
2025-09-25
2025-10-31
2025-12-06
2025-09-17
2025-11-03
2025-12-07
2025-11-19
2025-08-04
2025-05-26
2025-05-13
2025-04-08
2025-04-05
2025-03-30
2025-03-26
2025-03-05