【纵横网】ChatGPT开发公司OpenAI日前推出新生成式人工智能(AI)模型“Sora”,可根据文字提示及要求生成短影片,虽然目前只提供最长60秒AI生成影片,画面细节亦尚有少许瑕疵,但影片质量及多元化依然令各界印象深刻,加上Sora为当今唯一进入“影片生成”市场的产品,因而引发热烈讨论。分析认为Sora的面世不但令AI风潮持续加温,亦造成三大行业即将变天。
PHOTO/IZONGHENG.NET资料库
一句文字即生成视频 OpenAI:Sora模型尚未完美
OpenAI在社交平台X账号示范多段由Sora生成影片,包括将38字prompt(提示)转变而成的影片,以航拍角度拍摄行人在“东京”雪中漫步的景象。此外,OpenAI在帖文留言和公司网站同时展示,Sora将文字转变而成的城市夜景、越野车行走山路、漫游艺术馆以至立体动画等影片。
OpenAI表示,Sora能够根据使用者给予的提示生成影片,内容可包含多个角色以及特定类型的动态画面,也将根据提示的主题与背景精准生成影片内容,并可呈现复杂的摄影机运镜,并且除根据文字产生影片外,Sora也可以依据静态图像制作动画。
不过OpenAI指出,Sora目前仍为未完成的产品,可能难以消化复杂的物理或空间细节,不仅影片长度最多只能达到60秒,生成出的影片或不合逻辑,例如人类在跑步机上跑错方向等,同时未必能完全遵循特定的运镜轨迹。
公司续指,正为Sora安排红队演练(Red Teaming),即探测安全漏洞、其他系统缺陷,也会向艺术家、设计师和电影制作人提供试用。至于对于AI生成影片会否被用于伪造真相用途,OpenAI称,正同步开发工具来检测影片是否由Sora生成,一旦未来向大众提供Sora服务时,也会将诠释资料(Metadata)嵌入至影片中。
多模态大模型将为生成式AI重点发展方向
Sora发布后,OpenAI的估值进一步水涨船高。《纽约时报》报道,市场预计在最新一轮由创投公司Thrive Capital牵头融资中,OpenAI的估值预计将超过800亿美元;而去年年初ChatGPT刚发布不久后,OpenAI的估值约为290亿美元。
此前,OpenAI推出的ChatGPT在数千个英伟达GPU上进行训练和运行,让芯片龙头英伟达Nvidia(NVDA)今年股价累计升幅已接近50%,市值在过去一周接连超越亚马逊和谷歌,成为美股第三大公司。
随着文生图及图片对话技术的成熟,文生影片已成为多模态大模型下一步发展的重点。市场认为,今年大模型领域的竞争将进一步白热化,多模态大模型将成为生成式AI的重点发展方向,并推动AI基础设施的需求。
国泰君安指出,Sora模型推动AI多模态领域飞跃式发展,AI创作等相关领域将迎来深度变革,AI赋能范围进一步扩大,多模态相关的训练及推理应用也将进一步提升对算力基础设施的相关需求。
中信证券表示,多模态大模型算法的突破将带来自动驾驶、机器人等技术的革命性进步,持续看好本轮生成式AI浪潮对科技产业的长周期影响与改变,持续关注算力、算法、数据、应用等环节的领导厂商。
另外,近日投行高盛和摩根士丹利都以人工智能需求激增为由,上调了英伟达的目标股价,带动了台积电等厂商股价大涨。全球对算力需求的激增,也推动更多科技公司开始研发自己的人工智能芯片。目前Google、微软(MSFT)、亚马逊(AMZN) 等巨头企业相继推出客制化的AI芯片。《彭博》引述知情人士透露,OpenAI在寻求AI芯片制造的能力,正争取美国政府批准一项与中东投资者相关的大规模芯片合资计划。
《彭博》报道又指,软银行政总裁孙正义正寻求集资1,000亿美元,以创立一家AI芯片企业,希望在业务上与旗下Arm(ARM)互补之余,并与Nvidia展开竞争。
三大产业或重塑 拉响失业警报
Sora面世除大幅推动人工智能基础设施的需求,同时市场认为将对传统影视产业、短影片行业及广告业三个行业造成强大冲击。
Sora不但可根据文字产生影片外,也可依据静态图像制作动画,AI音乐创作者Beff Jezos社交平台X发文,表示迪斯尼旗下计算机动画制片厂Pixar将会完蛋了“GG Pixar(彼思工作室完蛋了)
Tesla创办人马斯克也对这条推文发表了回应“gg humans(人类完蛋了)”。
360创办人周鸿祎对Sora给予了极高的评价,其诞生意味着AGI(通用人工智能)实现可能从10年缩短至一两年。他又指,Sora或带来产业就业问题,直言对广告业、电影预告片、短片产业带来巨大的颠覆。
周鸿祎表示,很多人担心Sora对影视产业的打击,但影片的主题、脚本和分镜头策划、台词的配合,都需要人的创意,至少需要人给提示词,因此AI不一定那么快颠覆所有产业,反而能激发更多人的创作力。
工信部信息通信经济专家委员会委员、数位经济专家刘兴亮称,AI生成的影片可能减少了对人类演员、导演和其他创意角色的需求,从而影响到就业。此外,随着AI技术的进步,传统的影视制作流程和商业模式也可能面临重塑。
刘兴亮指,Sora能够生成持续一分钟左右的1080P高清影片,涵盖多个角色、不同类型的动作和背景细节等,几乎达到了电影级别的逼真场景。这种能力不仅为内容创作者提供了前所未有的工具,使他们能够以更低的成本和更快的速度将创意变为现实,而且为观众带来了更丰富和多样化的视觉体验。技术创新的这一巨大飞跃,预示着AI在未来人类生活的各方面都将发挥更加重要的作用。
他补充,这种转型并不意味着传统影视产业的消亡,而是需要与AI技术融合,探索新的艺术形式和表达方式。
至于中国企业资本联盟副理事长柏文喜表示,例如在影视产业,人人都是导演的时代即将来临,Sora可以快速产生逼真的场景和特效,帮助制作人员更好地实现创意,提高制作效率。在广告业,Sora可以根据品牌需求和营销目标,快速产生高质量的广告。
国盛证券表示,AI文生影片是多模态应用的下一站。文生影片即根据给定的文字提示直接产生影片。随着文生视讯技术的日趋成熟和广泛应用,或将为当下热门的短剧市场带来变量。该技术可望大幅降低短剧制作的综合成本,为解决“重制作而轻创作”的共通性问题提供解决方案,短剧制作的重点有望回归高质量剧本创作。