Sora视频生成效果炸裂,颠覆谁、利好谁?
2024-05-20 【 字体:大 中 小 】
没有任何预料,龙年伊始,投向市场一记惊雷的仍是AI。
春节假期尾端,OpenAI公布了其新一枚“王炸”级产品——Sora文生视频大模型,60秒的超长生成能力、逼真的视觉效果,让业内大呼人类与AGI的距离将被指数级压缩。
这仿佛梦回2023,由ChatGPT热所引发的AIGC朝拜一般。市场在春节前对于AI板块原本的犹豫、疑虑荡然无存,人工智能仍然牢牢坐稳摩尔时间。
从生成文字、图片上升到视频,OpenAI全面碾压同行。那么,Sora为AI产业注入哪些新动能,对于行业发展来说又意味着什么?
Sora横空出世,颠覆了谁?
在Sora横空出世之前,市面已流行多款文生视频大模型,例如Pika、RunwayML等等,但它们最多只能生成20秒的视频,均达不到像Sora一般的超长时长、世界模型、多镜头切换的特点,也不能保持高清的视觉质量。
同时,Sora还颠覆了业内的既往认知——多模态对于算力的耗费程度远大于纯文本生成。比如以Gemini为例,机构推测其参数规模至少达到万亿级别。而根据纽约大学谢赛宁推算,Sora参数量约为30亿。
产品效果如此惊艳、却又不会消耗大量GPU,Sora究竟是怎么做到的?综合业内的分析来看,Sora强大涌现能力的产生源泉有三:足量的数据、优质的标注、灵活的编码。据介绍,Sora在训练时可以不依赖于人工标注的数据,而是依靠机器的自我标注。同时,OpenAI搭建了一种新型的模型DiT(transformer + diffusion),而非依赖transformer这一单一技术架构。
至此,OpenAI已经横扫文生图(DALL·E3)、文本生成(ChatGPT)以及文生视频(Sora)三大核心科技。不仅如此,跟据《华尔街日报》最新报道,OpenAI CEO山姆·奥特曼正在推进一项雄心勃勃的计划,拟筹集至多7万亿美元,用于提高全球芯片制造能力。若筹资成真,将意味着OpenAI几乎全面占领AGI赛道中的所有关键卡位。
OpenAI的“野心”似已明朗,那就是做一个超级闭源的AGI巨无霸。面对一个冉冉升起的“科技巨头”,不少行业、个体将再次受到冲击。专家分析,Sora的诞生将首先对影视、广告、教育、游戏等多个行业产生直接影响。例如,视频创作者可以专注于更具创意性和战略性的工作,而将繁琐的重复性工作交给人工智能。
而在二级市场上,传统视频工具类公司均受到不同程度挫伤。例如,美股软件巨头Adobe在Sora发布次日暴跌超7%。据悉,Adobe的主要收入构成是数字媒体服务,包括对于视频、图片的二次加工、编辑,其中公众耳熟能详的Photoshop便是由Adobe出品。
(Adobe近日股价走势,数据来源:雪球)
为行业带来哪些新的思考?
目前,Sora尚处于定向邀请阶段,还未大面积向公众普及。专家预计,Sora全面推出的时间可能是在今年8月份。在这期间,一些和Sora高度同质化的公司仍将受到不同程度的冲击。
但是,新的机会也在孕育,新的理念正在形成。对于AI大模型领域来说,规模参数越大效果越好的既有观念被重新审视。如前文所述,Sora的参数仅为约30亿,但是其超强的生成能力却是有目共睹。
针对算力参数与模型性能的关系,百融云创(百融云-W,6608.HK)CEO张韶峰此前曾呼吁,对于行业大模型来说,需要警惕陷入“博算力”的误区。他认为,模型“大非万物”,重点是要寻求算力参数、用户意图与实时反馈之间的平衡。
“提升模型的响应速度、适度压缩算力成本,反而可以求得推理能力最优解,从而形成数据迭代、模型更新及用户响应的闭环飞轮。”张韶峰表示。
在张韶峰看来,在算力资源有限的情况下,通过模型优化和动态调整、提高算法效率、提升硬件适配度以及建立持续学习和自我优化的系统,通过用户的适时反馈来调整模型,便可以提高解决方案的准确性,最大化缔造AI技术的生产价值。
“大家都非常渴望大模型,反而会造成一种浪费。重要的是要在具体场景下彻底打通业务,形成一定的商业闭环。”张韶峰说道。
据介绍,百融云创于2023年打造了产业驱动大模型BR-LLMs,并自主构建了大模型预训练、微调、推理工程优化、应用开发套件等一整套技术栈。其中,以BR-LLM为基座的Cybertron平台内置丰富插件工具,对外输出Agent、Copilot等服务。
而除了和Sora颇为相似的“算力平衡”理念外,百融云创也并没有追逐LLM的单一力量,如前文所述,Sora的智能涌现力来自于LLM与diffusion的合力,而百融云创采用的是将决策式AI与生成式AI有机融合来为垂直行业提供AI产品服务和解决方案。
例如,在金融行业的智能营销领域,由于传统的营销方法耗时耗力,转化率受到制约。因此通过AI技术来提升营销效率成为普遍选择,但若仅仅依靠生成式AI技术效果却不尽如人意。
诚然生成式AI在个性化的信息推荐、营销活动响应方面存在诸多优势,但是由于缺乏前期的客户分析和行为预测,会使得LLM模型对于客户偏好和需求认识不足,不能有针对性的生成营销信息。金融机构甚至发现,投入大量成本开展营销的效果和不做一致。而融合了决策式AI的CRM系统可以将LLM模型功能的“天花板”被直接打开,大幅提升全客群模型的营销转化率。
Sora的问世带来了全新的憧憬和想象,标志着一个新的时代到来。分析人士认为,Sora将驱动AI大模型板块商业化落地加速,AI与场景的结合更为紧密,对于像百融云创这样深耕在垂直领域的AI公司构成行业性利好。
猜你喜欢
沙特阿美:人工智能技术帮助降低成本和减少碳排放
招商南油(601975)8月7日主力资金净买入24318万元
熟悉的华为回来了
惠州:雨天就侥幸?一超员面包车被查获
2024年3月18日湖南吉首市蔬菜果品批发大市场价格行情
3月1日基金净值:博时裕隆灵活配置混合A最新净值3097,涨049%
中国女排争四强,全红婵、陈芋汐巅峰对决,11岁郑好好登场
6月13日,来花都红山村寻觅多彩乡村
比依股份(603215)2024年中报简析:增收不增利,公司应收账款体量较大
《热辣滚烫》:女性的坚持与梦想
新文化股票股吧:最新资讯、深度分析、交流互动
马山茶业:匠心传承客家炒绿打造梅州高原上的生态茶园丨广东农企品牌价值50强评选巡礼
“光明好房家年华”启动!当日吸引超300批客户登记
解锁股票杠杆秘诀:玩转杠杆平台致富之道
马斯克已做好入职下一届美国政府的准备 亿万富翁马斯克在自己的社交媒体
论小吃,“帝都”就没输过!这10种美食吃过5种以上,北漂不低8年
大行评级|中银国际:腾讯音乐次季业绩符合预期 目标价降至51港元
三棵树(603737)8月9日主力资金净买入110542万元
smart考虑推出Fortwo电动继任车型 或命名精灵#2
艾德权程ESOP:股权融资利好企业发展壮大,规避‘大坑’是关键