据悉,Aug X发布了Augie,这是一个人工智能视频创作平台,结合了语音克隆功能。
Aug X与ElevenLabs合作,允许用户录制自己或他人的声音,并将其克隆用于其他短视频。Augie平台主要面向营销人员和社交媒体团队,帮助人们无需学习音频和视频编辑即可快速在视频中添加旁白、照片、文本和音乐。
Aug X的创始人Jeremy Toeman表示,在意识到有些人不喜欢对着麦克风说话或录制画外音后,该公司希望添加语音克隆功能。
他说:“你会惊讶于有这么多人使用了我们的语音克隆功能,因为这能够解决了他们不喜欢录制旁白的问题。”,在The Verge的一个演示中,Toeman说,用户可以编写或上传一个脚本到Augie,然后使用预先录制的语音(人们需要录制他们说话的语音片段),也可以从库中选择一个。然后,这个声音会以严肃、热情、令人毛骨悚然等语气阅读脚本,语气可以根据视频的情绪进行调整。
用户还可以从照片库中进行选择——Aug X授权Getty图片的照片——或者使用人工智能生成的图像添加到视频中。
Augie于5月开始公测。目前,每个使用Augie的人都可以使用语音克隆功能。Toeman表示,最终,由于与合作伙伴一起运行语音克隆服务器的费用,它可能会限制非付费用户的视频长度、质量和克隆语音的数量。
语音克隆并不是什么新鲜事;三星甚至允许人们使用人工智能语音接听电话,现在像Aug X这样的公司正在将这项技术集成到功能更全的服务中。Drake的一首深度伪造的歌曲以人工智能生成的说唱歌手的声音版本为特色,在网上疯传后,它重新引发了人们对版权和非法使用他人肖像的担忧。
Toeman说:“我们已经预先考虑了可能出现的问题,所以我们非常小心谁可以使用预先录制的声音进行克隆。”,他补充说,与Augie library的录音不同,录音将只提供给个人账户。因此,同一组织中的另一个人必须在他们的Augie账户上重新记录他们发言人的声音,以复制他们的演讲。用户不能上传录音,平台只接受用现场麦克风录制的声音。
该公司还与语音克隆合作伙伴ElevenLabs合作,识别人工智能生成的语音和视频。
审核编辑:彭菁