Midifan 来到「森林岛」总部探寻时尚设计之源

UE Pro 正式开启 25 年促销,旗舰 UE Premier Pro 直降 8500 元

Waves 发布 Curves AQ:世界首款自主型均衡器

Cycling’74 亚洲交流会火热报名中,附日程抽奖活动

Midifan 亲临 PreSonus 大中华区新代理德成音频,看看他们要搞什么事儿?


Dubbing X 文本转语音功能导演模式和普通模式介绍

官方新闻稿 发布于 前天 ·

分享到微信

DubbingX的文本转语音(TTS)功能是其核心亮点之一,既功能丰富又易于上手。该功能提供两种模式:普通模式和导演模式。普通模式适用于Vlog旁白、纪录片解说、单人有声书等场景,适合单人发声需求。而导演模式则专为对白和对话场景设计,支持多角色同时发声,用户可以根据需求在界面上轻松切换模式,实现复杂对话场景的快速生成。


导演模式


产品介绍

【DubbingX】的功能涵盖语音合成TTS(Text-To-Speech)、音色迁移转换、音色采集自制、歌声迁移转换、歌声合成、AI音乐生成等。

【DubbingX】已经成为全球唯⼀、情绪语态丰富度⾼达近2500种、所有⽣成环节⽤⼾完全可控的顶尖专业AI⾳频⽣成⼯具,赋予游戏、影视、动漫、有声、数字⼈、机器⼈、智能交互等⾏业客⼾拟真度极⾼、情绪表现⼒极强、可控度极⾼的AI数字⾳频⽣产能⼒。所有音色版权合规可商用,助您降低高达80以上的配音制作成本。


应用场景

【DubbingX】的应用场景非常广泛,涵盖了有声书创作、广告与宣传、影视与动漫制作、教育与在线培训、个人创作与短视频博主、以及业余唱歌爱好者等多个领域。无论是专业制作还是个人创作,【DubbingX】都能提供强大的支持。


步骤1、进入导演模式

在DubbingX的文本转语音界面,我们可以看到一个按钮——【导演模式】。点击后,系统会提示“清空所有文件”,意味着在普通模式下生成的数据不会被保留。如果确认进入导演模式,就可以开始体验更加专业的语音合成功能。

导演模式特别适合处理大段对白。我们可以直接复制剧本文本并粘贴到文本框内,系统会自动分割对白,使每一行文字成为单独的语音单元,方便后续角色分配和情绪管理。


(上图为进入导演模式的位置)

步骤2、自动情绪识别和一键整理

导演模式提供自动情绪识别功能,只需开启【自动情绪】选项,系统会根据上下文智能分析并分配基础情绪。例如,如果一段对白表现出愤怒或焦虑,系统可能会自动选择“抓狂”或“混乱”等情绪,帮助用户更快完成情绪设定。 

此外,【一键整理】功能会将剧本文字自动拆分为单句对白,每一行对白都对应一个独立的语音单元,使得对白管理更加清晰。


(上图为自动情绪识别和一键整理的位置)

步骤3、批量选角功能

在导演模式下,我们可以对多个对白批量设置角色。例如,我们可以勾选同一角色的句子,然后点击【批量选角】。系统会提供多个音色供选择,我们可以试听后决定最终的语音角色。例如,父亲角色通常适合中年或老年男性音色。选择后,所有已勾选的对白会自动应用该音色,避免逐条修改的繁琐操作。


(上图为批量选角的位置)

步骤4、批量情绪管理

和批量选角类似,导演模式还提供【批量情绪】功能。用户可以勾选多句对白,然后批量设置情绪。例如,在一场激烈的争论场景中,多个角色可能都需要带有“愤怒”或“激动”的情绪,我们只需一次操作即可完成所有句子的情绪调整。 

除了情绪类型,用户还可以批量调整语态强度、语速以及语调的高低,甚至可以统一更改语言类型,使对白更加符合预期。


(上图为诶批量情绪管理的位置)

步骤5、语音生成和下载

完成角色分配和情绪设定后,用户可以点击【批量生成】按钮,一次性生成所有选定对白的语音文件。

DubbingX提供两种下载方式:一是批量下载:将每一句对白单独保存为一个音频文件(如第1句为一个文件,第2句为另一个文件)。二是合并下载:将所有对白合并成一个完整音频文件,按对白顺序播放。批量下载适合后续手动剪辑,而合并下载则适用于快速试听整体效果。


(上图为批量生成的位置)


(上图为批量下载的位置)


使用示例

假设我们要为一部动画配音,其中有一段父子争论的对白。我们可以按照以下步骤使用导演模式:

  • 输入剧本:复制并粘贴剧本文本到导演模式的文本框中。
  • 一键整理:点击【一键整理】让对白自动拆分。
  • 自动情绪:开启【自动情绪】,让系统智能识别情绪。
  • 批量选角:将“父亲”对白批量设为中年男性音色,将“儿子”对白批量设为青年男性音色。
  • 批量情绪:为争论中的对白批量设为“激动”情绪,并稍微提高语速。
  • 批量生成:一次性生成全部对白音频。
  • 下载音频:选择批量下载或合并下载,根据需求进行后期处理。

(以上视频为具体的导演模式示例)


总结 

DubbingX的导演模式大幅提升了文本转语音的效率,特别适合多角色对白场景。通过自动情绪识别、批量选角和批量情绪管理等功能,用户可以快速创建高质量的对白音频,节省大量人工调整的时间。无论是影视、游戏、有声书还是广告创作,导演模式都能提供极大的便利。如果你需要更加自然、富有表现力的AI配音,DubbingX的导演模式无疑是你的最佳选择。 



普通模式


DubbingX的文本转语音(TTS)功能是其核心亮点之一,既功能丰富又易于上手。该功能提供两种模式:普通模式和导演模式。普通模式适用于Vlog旁白、纪录片解说、单人有声书等场景,适合单人发声需求。而导演模式则专为对白和对话场景设计,支持多角色同时发声,用户可以根据需求在界面上轻松切换模式,实现复杂对话场景的快速生成。今天我们主要讲的是普通模式。


产品介绍

【DubbingX】的功能涵盖语音合成TTS(Text-To-Speech)、音色迁移转换、音色采集自制、歌声迁移转换、歌声合成、AI音乐生成等。【DubbingX】已经成为全球唯⼀、情绪语态丰富度⾼达近2500种、所有⽣成环节⽤⼾完全可控的顶尖专业AI⾳频⽣成⼯具,赋予游戏、影视、动漫、有声、数字⼈、机器⼈、智能交互等⾏业客⼾拟真度极⾼、情绪表现⼒极强、可控度极⾼的AI数字⾳频⽣产能⼒。所有音色版权合规可商用,助您降低高达80以上的配音制作成本。


应用场景

文本转语音技术不仅适用于游戏配音,还广泛应用于多个领域,包括:
  • 短视频和直播配音:让你的内容更生动,不必自己录制音频,轻松实现专业级别的旁白效果。
  • 智能客服:打造更加自然的智能语音助手,提高用户交互体验。
  • 有声书制作:高效完成大段文字的朗读,节省时间和精力,提供高质量的听书体验。
  • 学习辅助:帮助学习语言发音,提升听力理解能力,适用于外语学习者。
  • 企业宣传:快速生成专业的广告宣传语音,应用于企业推广和品牌宣传。
  • 播客与电台:无需真人录音,即可制作高质量播客内容。

步骤1、输入文本

在文本框中输入想要转化为语音的内容。


(上图为输入文本的位置)

步骤2、选择角色

根据需求选择适合的声音角色,如青年男性、温柔女性等。


(上图为选择角色的位置)


(上图为点击“选择角色”按钮后出现的可选择的角色页面,并且可以依据关键词进行检索)

步骤3、试听音色与选用

在生成之前,可以先试听不同音色,选择最合适的声音。


(上图为对角色试听和选用的位置)

步骤4、调整参数

首先,支持多种语言,满足不同场景需求。其次,可以选择语气,如温和、兴奋、愤怒等。最后,进一步调整情绪强度、语速快慢以及语调高低。


(上图为选择语言的位置)

步骤5、生成语音

点击生成,即可快速获得语音文件。值得一说的是,并不是生成的音频就能听感好,进行试听后您或许还需要调整之前所提到的各种参数,甚至更换角色,才能达到合适的效果


(上图为生成语音并进行下载的位置)

步骤6、设置生成地址(可选)

如果您想确定或更改下载的地点,则可在左下方的【设置】中进行更改。随后页面的上方就可以更改确切地址。


(上图为设置的位置)


(上图为更改文件下载地址的位置)


案例演示

假设你是一名游戏主播,正在讲解一场激烈的对局,你可以输入如下文本:

“下路一直叫我去,我怎么去嘛!对面一直进我野区!”

然后,我们选择青年男性角色,并调整情绪为生气,选择大声模式,最后调整语态强度稍强、语速稍快,最终生成一条极具表现力的语音效果。
如果初次生成的语音效果不理想,还可以更换不同角色或调整参数,直到获得满意的声音。

(以上是具体的视频示范)


功能优势

由此可见,相比传统的真人录制,文本转语音技术具有诸多优势:

  • 节省成本:无需聘请专业配音员,自动生成高质量语音。
  • 效率更高:几秒钟内即可完成语音生成,比人工录制更快速。
  • 高度可定制:可调整语音参数,满足不同风格需求。
  • 稳定性强:无论生成多少次,语音风格始终一致。


总结 

文本转语音技术正在迅速发展,为各类内容创作者提供了便捷高效的语音生成方案。通过简单的操作,用户即可自定义音色、语速、情绪等参数,轻松获得高质量语音输出。无论是短视频配音、智能客服、有声书制作,还是企业宣传、学习辅助等场景,TTS 技术都能显著提升效率并降低成本。未来,随着人工智能的进步,文本转语音将更加自然、个性化,提供更丰富的语音表达,让内容创作更具创意和感染力。




文章出处 https://mp.weixin.qq.com/s/6ZJ5UxIF73GtfQhz0LeZcg

转载新闻请注明出自 Midifan.com

暂无评论