OpenAI首席技术官:Sora或将在今年向大众推出,增加生成音频
OpenAI首席技术官米拉·穆拉蒂(Mira Murati)Sora文生视频工具计划今年正式推向公众。此外,OpenAI还计划为Sora增加音频生成功能,进一步丰富视频的场景和情感表达。

目前,Sora模型具有输出60秒视频的能力,包括高度详细的背景、复杂的多角度镜头、情感角色和动物角色,自推出以来引起了行业和消费者的广泛关注,但Sora只对测试团队和一些视觉艺术家、设计师和电影制片人开放, 普通人很难体验Sora文生视频的魅力。
穆拉蒂透露,Sora制作视频的成本太高,这是Sora难以普及的一个重要原因。该团队正在优化相关技术,以促进Sora造福更多人。她还表示,OpenAI计划添加音频功能,并允许用户编辑Sora生成的视频内容,以使视频更符合要求。

Sora的研究表明,扩展视频生成模型是构建物理世界通用模拟器的一种非常有前途的方式。360创始人周曾评论道:“一旦人工智能连接到摄像头,观看所有电影,观看YouTube和Tiktok的视频,对世界的理解将远远超过文本学习。一幅画比千言万语好,离AGI(通用人工智能)真的不远了,不是10年20年的问题,可能一两年就能实现。”
随着Sora技术的不断进步和成本的降低,我们有理由相信,在不久的将来,这种创新的视频生成工具将不再是少数人的专属工具,而是成为公众创作的新宠。至于Sora的披露是否会促进通用人工智能的发展,我相信我们很快就会看到答案。
查看全文
作者最近更新
-
探秘传感器类型:开启智能感知新视界传感洞见
04-09 18:41 -
2030年,自动驾驶传感器市场将高达235亿美元传感洞见
2024-06-17 -
网络研讨会:利用无电池传感器打造物联网的未来!传感洞见
2024-05-28



评论0条评论