适合企业的TTS文本转语音接口:微软TTS最新模型,发布9种更真实的AI语音

2024-06-25 1346阅读

微软对Azure Al语音服务的Personal Voice功能进行了升级,引入了新的零样本学习(zero-shot)的文本到语音(TTS)模型。与初始模型相比,这些新模型提高了合成语音的自然度,并更好地模仿了提示语音中的语音特征。

微软提供了超过400种神经语音,涵盖140多种语言和地区。这些文本到语音(TTS)语音可以快速为应用添加朗读功能,使其设计更加无障碍,或为聊天机器人赋予声音,提供更丰富的对话体验。

适合企业的TTS文本转语音接口:微软TTS最新模型,发布9种更真实的AI语音

Microsoft Azure官网:

还要给大家说的是,目前微软Azure是免费的,但是,试用额度很快就会用完,而且后续企业付费用是没办法开国内合规发票的。

适合企业的TTS文本转语音接口:微软TTS最新模型,发布9种更真实的AI语音

企业如何获取Azure AI语音服务

目前企业需要通过微软官方合作伙伴获取服务,可以合规、稳定地提供企业用户使用Azure AI 语音服务、ChatGPT等的可能,满足国内发票需求。

通过微软官方合作伙伴获取服务,可以合规、稳定地提供企业用户使用ChatGPT的可能,满足国内发票需求,同时也能解决连接不稳定/响应速度慢/并发配额低等问题。

参考链接:

Azure AI 服务 OpenAI 4.0 开通申请

适合企业的TTS文本转语音接口:微软TTS最新模型,发布9种更真实的AI语音

另外有需要可以关注【全云在线】gz号,进OpenAI技术开发交流裙

更新体验:

https://ai.azure.com/explore/speech

新推出的多语言语音包括了针对对话风格的优化,扩展了微软在9种语言及其变种中传达内容的能力:

  • en-US-AvaMultilingualNeural
  • en-US-AndrewMultilingualNeural
  • en-US-EmmaMultilingualNeural
  • en-US-BrianMultilingualNeural
  • De-DE-FlorianMultilingualNeural
  • De-DE-SeraphinaMultilingualNeural
  • Fr-FR-RemyMultilingualNeural
  • Fr-FR-VivienneMultilingualNeural
  • zh-CN-XiaoxiaoMultilingualNeural

    特 点

    • 无论在创建基于语音的聊天机器人、语音助手还是对话代理,这些新语音都将确保交互更加逼真、栩栩如生和引人入胜。
    • 针对对话优化的语音在阅读对话和非正式文本时听起来更加自然和引人入胜。
    • 包括像笑声和填充停顿等感叹词,为虚拟对话增添了人性化的气息。

      应用场景

      1.语音助手:创建个性化的语音助手体验。用户现在可以使用自己的声音,而不是依赖通用的声音,实现真正独特的体验。2.游戏:为玩家提供沉浸式体验,允许他们完全以自己独特的声音扮演角色。语言配音:扩展全球影响力,用演讲者的母语为内容配音,为观众提供无缝目愉悦的体验,无论他们位于何处。3.媒体和娱乐:为故事、有声书、播客、视频等创建易于使用的个人语音,使内容比以往任何时候都更加贴近和沉浸。4.语音翻译:打破语言障碍,改善沟通。允许会话参与者以他们真实的声音被听到,用各种语言进行

      使用教程

      第一步:注册账号进入官网:

      https://azure.microsoft.com/zh-cn/products/ai-services/text-to-speech

      点击“免费试用文本转语音”,新用户可获得一年的免费使用额度:

      适合企业的TTS文本转语音接口:微软TTS最新模型,发布9种更真实的AI语音

      适合企业的TTS文本转语音接口:微软TTS最新模型,发布9种更真实的AI语音

      点击“免费开始使用”,这里需要使用微软账号进行登录。

      适合企业的TTS文本转语音接口:微软TTS最新模型,发布9种更真实的AI语音

      然后进入添加个人信息资料的界面。

      适合企业的TTS文本转语音接口:微软TTS最新模型,发布9种更真实的AI语音

      手机号验证勾选“其他电话号码”,地区选择中国,然后输入自己的手机号接收验证码即可:

      适合企业的TTS文本转语音接口:微软TTS最新模型,发布9种更真实的AI语音

      填写完资料后,点击下一步进入信用卡验证,信用卡不会扣费,但要保证里面有1美金才能验证成功。

      适合企业的TTS文本转语音接口:微软TTS最新模型,发布9种更真实的AI语音

      验证成功后会跳转到Azure主页,点击“转到Azure门户”进入Azure控制台:

      适合企业的TTS文本转语音接口:微软TTS最新模型,发布9种更真实的AI语音

      第二步:部署语音服务展开左上角菜单栏,打开所有服务:

      适合企业的TTS文本转语音接口:微软TTS最新模型,发布9种更真实的AI语音

      在所有服务下找到“AI+机器学习”类别,选择语音服务并创建:

      适合企业的TTS文本转语音接口:微软TTS最新模型,发布9种更真实的AI语音

      创建界面的名称可以随便填,定价层选择“Free F0”,然后点击“审阅并创建”:

      适合企业的TTS文本转语音接口:微软TTS最新模型,发布9种更真实的AI语音

      继续点击“创建”:

      适合企业的TTS文本转语音接口:微软TTS最新模型,发布9种更真实的AI语音

      稍等十秒左右语音服务就部署完成了。

      适合企业的TTS文本转语音接口:微软TTS最新模型,发布9种更真实的AI语音

      第三步:创建语音点击“转到资源”:

      适合企业的TTS文本转语音接口:微软TTS最新模型,发布9种更真实的AI语音

      继续点击“转到Speech Studio”:

      适合企业的TTS文本转语音接口:微软TTS最新模型,发布9种更真实的AI语音

      Speech Studio里有很多语音服务,比如“语音转文本”、“语音转字幕”等等,都可以直接使用。

      适合企业的TTS文本转语音接口:微软TTS最新模型,发布9种更真实的AI语音

      下滑找到文本转语音服务的语音库,点击进入:

      适合企业的TTS文本转语音接口:微软TTS最新模型,发布9种更真实的AI语音

      在这里我们就可以看到不同国家的各种声音模型,之后Microsoft Azure上新语音模型也会更新到这里。

      每个声音模型也都配置了不同的对话场景和情绪,甚至还有各种方言,可以说是目前市面上最全的AI语音库了。

      适合企业的TTS文本转语音接口:微软TTS最新模型,发布9种更真实的AI语音

      随便点击一个试听一下效果:


      ,时长00:22

       

      效果虽然没法和开头展示的语音效果相媲美,但是已经非常接近真人声音了。

      选择好想用的声音模型,点击转到有声内容创作。

      把文本内容粘贴到文本框,点击播放按钮就可以进行语音合成。

      右侧操作栏可以设置语言、声音模型和说话风格以及气口停顿等等功能,非常齐全。

      适合企业的TTS文本转语音接口:微软TTS最新模型,发布9种更真实的AI语音

      语音制作完毕之后,点击保存并导出为本地文件,一份文本转语音文件就制作好了。

      适合企业的TTS文本转语音接口:微软TTS最新模型,发布9种更真实的AI语音

      之后再制作有声读物、小说推文或者是其他有声内容时就可以直接使用Microsoft Azure。无论是声音模型的丰富度还是功能的易用性,Microsoft Azure基本上就相当于语音合成领域的OpenAI。

VPS购买请点击我

免责声明:我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自自研大数据AI进行生成,内容摘自(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供学习参考,不准确地方联系删除处理! 图片声明:本站部分配图来自人工智能系统AI生成,觅知网授权图片,PxHere摄影无版权图库和百度,360,搜狗等多加搜索引擎自动关键词搜索配图,如有侵权的图片,请第一时间联系我们,邮箱:ciyunidc@ciyunshuju.com。本站只作为美观性配图使用,无任何非法侵犯第三方意图,一切解释权归图片著作权方,本站不承担任何责任。如有恶意碰瓷者,必当奉陪到底严惩不贷!

目录[+]