只需15秒即可复制声音? OpenAI 承诺严格控管

随着技术的持续飞跃,美国人工智能开发巨头OpenAI不仅在利用AI生成文字、图片和视频方面取得了显著成果,现在还成功打造了一款能够复制语音的工具。然而,鉴于潜在的滥用风险,OpenAI目前仅向合作伙伴提供此工具,并未计划对外开放。

仅需15秒声音样本,快速复制人声
近日,OpenAI公开了一款名为“Voice Engine”的语音复制工具。根据初期的测试结果,这项技术能够以高度逼真的人声朗读文字。与以往生成的语音内容不同,“Voice Engine”能够模仿个人的语调和节奏,生成一段自然流畅的谈话。OpenAI声称,仅需15秒的说话声音样本,就能快速复制出该人的声音,且生成的语音不受样本语言和种类的限制。例如,即使母语为英语的人,也能通过该技术生成用法语、西班牙语、中文或其他语言讲述的语音。

AI生成语音真假难辨,引发安全风险
然而,随着这项技术的问世,其潜在的滥用风险也日益凸显。《纽约时报》、《美联社》等媒体纷纷报道指出,OpenAI正进军语音技术领域并申请相关商标,但测试结果显示,这项技术可能被用于破坏线上银行账户的声纹认证系统。此外,鉴于今年是选举年,若制造出类似关键人物声音的深度伪造信息,可能会误导公众。因此,有观点认为OpenAI在更广泛地发布这项技术时应持谨慎态度。

对此,OpenAI已意识到这些问题,并表示目前仅与少数组织和开发者测试这项功能。他们在声明中强调:“我们深知生成类似某人声音的谈话存在严重风险,尤其在选举年更加引人注目。”同时,Voice Engine的测试合作伙伴已同意遵守规范,即未经当事人同意不会模仿其声音,并会明确标注语音是由AI生成的。

标签