Sora视频生成效果炸裂,颠覆谁、利好谁?
2024-05-20 【 字体:大 中 小 】
没有任何预料,龙年伊始,投向市场一记惊雷的仍是AI。
春节假期尾端,OpenAI公布了其新一枚“王炸”级产品——Sora文生视频大模型,60秒的超长生成能力、逼真的视觉效果,让业内大呼人类与AGI的距离将被指数级压缩。
这仿佛梦回2023,由ChatGPT热所引发的AIGC朝拜一般。市场在春节前对于AI板块原本的犹豫、疑虑荡然无存,人工智能仍然牢牢坐稳摩尔时间。
从生成文字、图片上升到视频,OpenAI全面碾压同行。那么,Sora为AI产业注入哪些新动能,对于行业发展来说又意味着什么?
Sora横空出世,颠覆了谁?
在Sora横空出世之前,市面已流行多款文生视频大模型,例如Pika、RunwayML等等,但它们最多只能生成20秒的视频,均达不到像Sora一般的超长时长、世界模型、多镜头切换的特点,也不能保持高清的视觉质量。
同时,Sora还颠覆了业内的既往认知——多模态对于算力的耗费程度远大于纯文本生成。比如以Gemini为例,机构推测其参数规模至少达到万亿级别。而根据纽约大学谢赛宁推算,Sora参数量约为30亿。
产品效果如此惊艳、却又不会消耗大量GPU,Sora究竟是怎么做到的?综合业内的分析来看,Sora强大涌现能力的产生源泉有三:足量的数据、优质的标注、灵活的编码。据介绍,Sora在训练时可以不依赖于人工标注的数据,而是依靠机器的自我标注。同时,OpenAI搭建了一种新型的模型DiT(transformer + diffusion),而非依赖transformer这一单一技术架构。
至此,OpenAI已经横扫文生图(DALL·E3)、文本生成(ChatGPT)以及文生视频(Sora)三大核心科技。不仅如此,跟据《华尔街日报》最新报道,OpenAI CEO山姆·奥特曼正在推进一项雄心勃勃的计划,拟筹集至多7万亿美元,用于提高全球芯片制造能力。若筹资成真,将意味着OpenAI几乎全面占领AGI赛道中的所有关键卡位。
OpenAI的“野心”似已明朗,那就是做一个超级闭源的AGI巨无霸。面对一个冉冉升起的“科技巨头”,不少行业、个体将再次受到冲击。专家分析,Sora的诞生将首先对影视、广告、教育、游戏等多个行业产生直接影响。例如,视频创作者可以专注于更具创意性和战略性的工作,而将繁琐的重复性工作交给人工智能。
而在二级市场上,传统视频工具类公司均受到不同程度挫伤。例如,美股软件巨头Adobe在Sora发布次日暴跌超7%。据悉,Adobe的主要收入构成是数字媒体服务,包括对于视频、图片的二次加工、编辑,其中公众耳熟能详的Photoshop便是由Adobe出品。
(Adobe近日股价走势,数据来源:雪球)
为行业带来哪些新的思考?
目前,Sora尚处于定向邀请阶段,还未大面积向公众普及。专家预计,Sora全面推出的时间可能是在今年8月份。在这期间,一些和Sora高度同质化的公司仍将受到不同程度的冲击。
但是,新的机会也在孕育,新的理念正在形成。对于AI大模型领域来说,规模参数越大效果越好的既有观念被重新审视。如前文所述,Sora的参数仅为约30亿,但是其超强的生成能力却是有目共睹。
针对算力参数与模型性能的关系,百融云创(百融云-W,6608.HK)CEO张韶峰此前曾呼吁,对于行业大模型来说,需要警惕陷入“博算力”的误区。他认为,模型“大非万物”,重点是要寻求算力参数、用户意图与实时反馈之间的平衡。
“提升模型的响应速度、适度压缩算力成本,反而可以求得推理能力最优解,从而形成数据迭代、模型更新及用户响应的闭环飞轮。”张韶峰表示。
在张韶峰看来,在算力资源有限的情况下,通过模型优化和动态调整、提高算法效率、提升硬件适配度以及建立持续学习和自我优化的系统,通过用户的适时反馈来调整模型,便可以提高解决方案的准确性,最大化缔造AI技术的生产价值。
“大家都非常渴望大模型,反而会造成一种浪费。重要的是要在具体场景下彻底打通业务,形成一定的商业闭环。”张韶峰说道。
据介绍,百融云创于2023年打造了产业驱动大模型BR-LLMs,并自主构建了大模型预训练、微调、推理工程优化、应用开发套件等一整套技术栈。其中,以BR-LLM为基座的Cybertron平台内置丰富插件工具,对外输出Agent、Copilot等服务。
而除了和Sora颇为相似的“算力平衡”理念外,百融云创也并没有追逐LLM的单一力量,如前文所述,Sora的智能涌现力来自于LLM与diffusion的合力,而百融云创采用的是将决策式AI与生成式AI有机融合来为垂直行业提供AI产品服务和解决方案。
例如,在金融行业的智能营销领域,由于传统的营销方法耗时耗力,转化率受到制约。因此通过AI技术来提升营销效率成为普遍选择,但若仅仅依靠生成式AI技术效果却不尽如人意。
诚然生成式AI在个性化的信息推荐、营销活动响应方面存在诸多优势,但是由于缺乏前期的客户分析和行为预测,会使得LLM模型对于客户偏好和需求认识不足,不能有针对性的生成营销信息。金融机构甚至发现,投入大量成本开展营销的效果和不做一致。而融合了决策式AI的CRM系统可以将LLM模型功能的“天花板”被直接打开,大幅提升全客群模型的营销转化率。
Sora的问世带来了全新的憧憬和想象,标志着一个新的时代到来。分析人士认为,Sora将驱动AI大模型板块商业化落地加速,AI与场景的结合更为紧密,对于像百融云创这样深耕在垂直领域的AI公司构成行业性利好。
猜你喜欢
【不到4000元?努比亚竖折叠手机配置和价格曝光】 在MWC上,中国
一周大涨18%!奈飞(NFLXUS)成标普500“最靓的仔”,分析师承认“看走眼”
中铁装配(300374)3月13日主力资金净卖出240558万元
港股异动 绿叶制药(02186)涨近4% ERZOFRI获FDA上市批准用于治疗精神分裂
“格美”升级为超强台风!惠州多地高温橙色预警生效
2023年内蒙古自治区六处遗址考古取得新突破
新春走基层|山东:传统民俗上列车 高铁途中“闹”元宵
何穗法国街头大秀好身材,法式碎花裙秀性感香肩,夸张耳环太亮眼
莱斯信息新注册《莱斯移动式信号机管控系统软件V10》项目的软件著作权
【今日主题前瞻】里程碑合作,OpenAI将付费使用出版巨头的内容
他名不见经传,却写出大唐最美的一首诗,堪称千古绝唱
惠州一业主投诉装修公司违约,追赔偿款屡遭延期,企业回应了
中触媒最新公告:上半年净利润同比增长14589%
麻绎文的国泰沪深300增强策略ETF发起联接A(021847)值得买吗?
政策加码直击行业痛点!这一方向有望乘风而起
世界最小体积芯片!存储巨头量产238层NAND闪存,受益上市公司梳理
上汽发布2024半年报 营业总收入28469亿元盈利663亿
柏楚电子(688188)7月22日主力资金净买入31576万元
无锡银行(600908)8月16日主力资金净卖出88333万元
良品铺子降价求生,零食赛道的“宇宙尽头”也是卷价格?