微软亚洲研究院推出VASA-1工具可以将照片变成视频

2024-04-22 09:57:07   |   嫣然   |   278

在人工智能技术不断演进的今天,微软亚洲研究院推出了一款名为 VASA-1 的新型实验性人工智能工具,引发了广泛的关注和热议。这款工具能够实时创建栩栩如生的说话面孔,只需一张静态图像或一幅绘画以及现有的音频文件即可。然而,尽管该技术展示出了惊人的潜力,但也引发了人们对其潜在滥用的担忧。

VASA-1 的功能似乎令人难以置信,它可以为静态图像生成面部表情和头部动作,并匹配适当的嘴唇动作。研究人员上传了大量示例,这些示例足以欺骗人们认为它们是真实的。然而,仔细观察后可以发现,示例中的嘴唇和头部动作仍然有些机械化且不同步,暗示着这项技术仍处于发展阶段。

尽管如此,人们对 VASA-1 的滥用潜力感到担忧。研究人员已经意识到这一点,并决定暂时不发布相关产品,直到确定他们的技术将被负责任地使用并符合适当的规定。然而,他们并未透露是否计划实施某些保护措施,以防止不良行为者将其用于邪恶目的,例如制作深度伪造色情或错误信息活动。

据铋读网了解,研究人员仍然相信 VASA-1 的技术具有许多潜在的好处。他们表示,该技术可以用于增强教育公平,改善沟通障碍者的可及性,并为有需要的人提供陪伴和治疗支持。此外,他们还暗示 VASA-1 可以用于提供与人们可以交谈的人工智能角色的程序。

根据公布的论文,VASA-1 在 VoxCeleb2 数据集上进行了训练,该数据集包含了超过 100 万条来自 YouTube 视频的话语,涉及 6,112 名名人。尽管该工具是在真实面孔上进行训练的,但据称它也适用于艺术照片,例如《蒙娜丽莎》。研究人员甚至将其与安妮·海瑟薇病毒式传播的李尔·韦恩《狗仔队》的音频文件有趣地结合在一起,展示了其令人愉悦的效果。

特别提醒:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字、图片等内容的真实性、完整性、及时性本站不作任何保证或承诺,请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时发送相关信息至bireading@163.com,本站将会在48小时内处理完毕。

微软亚洲研究院推出VASA-1工具可以将照片变成视频

2024-04-22 09:57:07 浏览量: 278 作者: 嫣然

在人工智能技术不断演进的今天,微软亚洲研究院推出了一款名为 VASA-1 的新型实验性人工智能工具,引发了广泛的关注和热议。这款工具能够实时创建栩栩如生的说话面孔,只需一张静态图像或一幅绘画以及现有的音频文件即可。然而,尽管该技术展示出了惊人的潜力,但也引发了人们对其潜在滥用的担忧。

VASA-1 的功能似乎令人难以置信,它可以为静态图像生成面部表情和头部动作,并匹配适当的嘴唇动作。研究人员上传了大量示例,这些示例足以欺骗人们认为它们是真实的。然而,仔细观察后可以发现,示例中的嘴唇和头部动作仍然有些机械化且不同步,暗示着这项技术仍处于发展阶段。

尽管如此,人们对 VASA-1 的滥用潜力感到担忧。研究人员已经意识到这一点,并决定暂时不发布相关产品,直到确定他们的技术将被负责任地使用并符合适当的规定。然而,他们并未透露是否计划实施某些保护措施,以防止不良行为者将其用于邪恶目的,例如制作深度伪造色情或错误信息活动。

据铋读网了解,研究人员仍然相信 VASA-1 的技术具有许多潜在的好处。他们表示,该技术可以用于增强教育公平,改善沟通障碍者的可及性,并为有需要的人提供陪伴和治疗支持。此外,他们还暗示 VASA-1 可以用于提供与人们可以交谈的人工智能角色的程序。

根据公布的论文,VASA-1 在 VoxCeleb2 数据集上进行了训练,该数据集包含了超过 100 万条来自 YouTube 视频的话语,涉及 6,112 名名人。尽管该工具是在真实面孔上进行训练的,但据称它也适用于艺术照片,例如《蒙娜丽莎》。研究人员甚至将其与安妮·海瑟薇病毒式传播的李尔·韦恩《狗仔队》的音频文件有趣地结合在一起,展示了其令人愉悦的效果。

,

Copyright ©2018 铋读网 All Rights Reserved.

京ICP备18051707号

京公网安备 11011302001633号