

ChatGPT制造商OpenAI周一推出了一款名为Sora的视频生成器,人们只需输入对场景的描述,就可以制作出看起来逼真的短视频片段。
这项新服务并不是第一个广泛使用的视频生成器,但OpenAI作为人工智能市场领导者的地位,可以帮助合成视频在商业广告、艺术项目、电影和社交帖子中越来越普遍,但也可以用于恶作剧和深度伪造。
视频生成被人工智能高管称为生成式人工智能技术的下一个飞跃,该技术还为聊天机器人、图像生成器和音频生成器提供动力。上周,b谷歌向其云服务客户开放了自己的人工智能视频生成器Veo。
OpenAI网站上最近用Sora制作的视频片段显示,该工具能够制作高度逼真的镜头和一系列视觉风格,但也能扭曲日常物理和人体解剖。
在白雪皑皑的街道上,一所房子的窗户里闪烁着圣诞树的片段,以及僧侣们埋头研读古籍的黑白场景,看起来近乎逼真。在其他片段中,杂技演员和动物的四肢变形成不可能的形状,表明这项技术能够犯人类不会犯的错误。
人类肢体与其他物体或人之间的互动——比如踢足球或集体拥抱——似乎对这项技术尤其具有挑战性。
这些故障表明,OpenAI尚未解决Sora早期测试中突出的一些问题,包括2月份《华盛顿邮报》(The Washington Post)的测试,这些测试显示,它在描绘男人点香烟等过程方面存在困难。
普林斯顿大学(Princeton University)计算机科学教授阿尔温德·纳拉亚南(Arvind Narayanan)说:“从Sora的视频中可以明显看出,视频生成的难题还没有得到解决。”但他补充说,它的发布可能会产生商业影响,即使它不一定预示着重大的技术突破。
他说:“尽管有这些严重的限制,Sora在某些情况下可能会非常有用,因为OpenAI似乎已经投入了大量的工作来开发一个实际的产品,而不是简单地发布一个模型,让用户自己弄清楚怎么用它。”
OpenAI进入视频生成领域备受期待,周一下午,该公司网站上的注册功能被禁用。错误信息归咎于“繁忙的流量”,邮报记者无法访问该工具。
对于是否在Sora的公开推出中遇到了意想不到的问题,该公司没有回应置评请求。
Sora最初是在今年2月宣布的,它只对OpenAI聊天机器人ChatGPT的付费用户开放。
成本最低的计划是每月20美元,每月可以用Sora制作50个视频,最长不超过5秒。每月支付更多的费用可以让用户生成更多的视频,更长的和更高的分辨率。
OpenAI表示,Sora将在美国和许多其他国家的用户发布,但不包括英国和欧洲。首席执行官Sam Altman在X上表示,公司希望将Sora带到那里,但“我们也必须遵守监管规定”。
Captions是一家为视频创作和制作提供人工智能工具的初创公司,其首席执行官兼联合创始人高拉夫?米斯拉表示,乍一看,Sora“感觉很有竞争力,尽管远远超出了目前文本到视频世界模型的标准。”
他预测,库存录像行业将首先被Sora和其他基于人工智能的文本转视频程序所颠覆。
研究人工智能和错误信息影响的研究人员警告称,人工智能视频工具可以用来制作深度造假,即通过声称展示从未发生过的真实事件来欺骗人们的逼真视频。人工智能生成或修改的视频已经成为骚扰的工具,尤其是针对女性的,专家们担心它们也可能被用来操纵选举。
在周一发布的一份关于Sora功能和漏洞的文件中,OpenAI承认其服务可能“带来新的风险,例如滥用相似性或产生误导性或明确的视频内容的可能性。”
该公司表示,已试图通过过滤用于创建Sora的数据中的暴力和敏感内容,并进行“红队”测试以识别漏洞,来防范这些风险。
就在Sora准备发布的时候,OpenAI在上个月底暂停了用户对该工具的访问。此前,该公司邀请了一些艺术家来测试这项服务,他们推出了一个网页,允许公众免费使用Sora,并发表了一封公开信,抗议该公司把早期测试员当作无偿劳动力。