股票配资首选平台 ,中金:从OpenAI Sora看视频生成模型技术进展
2024-08-06 【 字体:大 中 小 】
股票配资首选平台 ,中金:从OpenAI Sora看视频生成模型技术进展
中金公司研报指出,2月15日,OpenAI发布最新视频生成模型Sora,能够生成长达一分钟的分辨率为1920*1080的高质量视频,在生成时长和生成质量上较其他现有模型和产品实现了明显突破。
中金认为,Sora实现了AI+视频场景的效果突破,通过借助Transformer架构展现了优异的可拓展性(Scalable)。展望未来,我们判断基于Transformer架构的大模型有望在更多模态领域实现复刻,看好多模态领域技术进展。
以下为其核心观点:
延续DiTs架构,Sora实现高质量长视频生成。根据技术报告,Sora延续DiTs架构,随训练计算量提升而展现出显著的生成能力提升(Scalable)。相较先前模型,我们认为其最为突出的创新之处在于:1)LDM自编码器实现时间维度压缩,使得长视频生成成为可能;2)直接对LDM中潜视频进行图块化处理并直接使用Transformer建模,解除输入格式限制的同时,能够创新性地实现任何像素和长宽比视频的生成;3)我们判断其训练数据集中可能包含带有物理信息的合成数据,从而使模型展现出对物理信息的初步理解能力;4)复用DALL·E 3的重标注技术,对视频数据生成高质量文字标注,借助GPT对提示词进行扩展,提升生成效果。
技术基础一:扩散模型是当前图片/视频生成的主要技术路线。扩散模型(Diffusion model)通过神经网络(主要是U-Net)从纯噪声图像中学习去噪过程,从而通过给定噪声来完成图像生成任务。潜在扩散模型(Latent diffusion model)通过降维进一步提升了训练效率并降低训练成本,成为图片生成的主要技术路线。在预训练的图片生成模型基础上,学界提出生成关键帧并在时序上实现对齐即可将图片生成模型转化为视频生成模型,但这类模型存在生成时长短、稳定性差等劣势。
技术基础二:Transformer架构的引入使扩散模型能够实现规模效应。DiTs(Diffusion transformer)将先前扩散模型的骨干U-Net卷积网络替换为可伸缩性更强的Transformer,从而能够实现更强的可拓展性,即能够通过增加参数规模和训练数据量来快速提升模型的性能表现,模型在图片生成任务上表现优异。W.A.L.T.首次将Transformer架构引入视频生成模型,使用窗口注意力降低了对算力的需求,并展现了良好的视频生成能力。
我们认为Sora实现了AI+视频场景的效果突破,通过借助Transformer架构展现了优异的可拓展性(Scalable)。展望未来,我们判断基于Transformer架构的大模型有望在更多模态领域实现复刻,看好多模态领域技术进展。
风险
技术进展不及预期;应用落地不及预期;行业竞争加剧。
股票配资怎么操作郴州股票配资网上炒股配资平台

猜你喜欢

股票配资首选平台 ,2022年道歉的基金经理们 2023年表现如何?


解锁财富密码:股票网上配资平台助力投资


股票配资:解锁投资新境界,助你财富增值


线上投资新时代:股票配资平台让您轻松入市


股票配资怎么做 ,通达信涨停板天数主图指标公式(附源码破译、测评和源码)


确保您的炒股安全:了解股票配资的安全策略


配资专业在线炒股配资 ,沪指八连阳收报300488点 AI应用端全天强势


小资金炒股配资平台:开启财富增值之旅


配资炒股首选配资平台,稳健收益,安全保障


选择正规股票配资平台的重要性


探究有配债的股票的表现和特点


解锁财富密码!十大股票配资助力投资新高度


呼伦贝尔股票配资:助力草原投资,成就财富梦想


上海股票配资:助力投资,把握市场机遇


炒股配资开户:轻松撬动资金,开启财富之路


个人股票配资:放大收益,谨慎入场


小资金炒股配资平台:开启财富增值之旅


配资炒股首选配资平台,稳健收益,安全保障


股票配资策略:助你提升收益,规避风险


股票配资风险:高收益下的隐形陷阱
