当前位置 »模态
世界波体育
世界波体育

广告区域

首部文生视频动画要来了!AI行情或进一步扩散!

2024年02月24日 / 网络热点 / 浏览:3 /

【新闻事件】

据央视频消息,中国首部文生视频AI系列动画片《千秋诗颂》启播暨中央广播电视总台人工智能工作室揭牌仪式将在今日举行。

【行业逻辑】

1、视频生成能力显著突破,向着AGI目标再进一步。东吴证券研报指出,相比行业原有视频生成模型gen2、pika等,Sora在语义理解能力、复杂场景理解能力、一致性以及生成视频时长等方面取得明显突破。1)模型层面,Sora是一种扩散模型,从一个看起来像静态噪音的视频开始生成视频,通过多个步骤去除噪音,逐渐转换视频。Sora可以一次性生成整个视频,也可以扩展生成的视频。与GPT模型类似,Sora也采用了transformer架构模型性能随着模型规模扩大而提高。新技术路径验证有望加速行业发展,算力需求有望增加。2)训练数据层面,Sora将视频和图像表示为更小的数据单元集合patch(类似于GPT中的token),通过统一数据表示方式,可在比以往更广泛的视觉数据上训练模型,包括不同的持续时间、分辨率和宽高比,最终生成的视频在这些维度也具有更高的灵活性OpenAI未将Sora单纯视作视频模型,而是将其作为“世界模拟器”,在物理世界模拟上已开始出现涌现效应,我们认为其亦有望为AI3D等其他多模态领域提供经验借鉴,多模态大模型有望加速发展。

浙商证券:OpenAI谷歌相继发力 有望引领多模态大模型浪潮

2024年02月17日 / 网络热点 / 浏览:3 /

  OpenAI 发布文生视频模型 Sora,可遵循用户的指示生成长达一分钟的视频,并保持视觉质量。浙商证券发布研报称,OpenAI 发布 Sora 模型,有望开启多模态大模型的新一轮浪潮。

  以下为研报摘要:

  近日,OpenAI 发布文生视频模型 Sora,可遵循用户的指示生成长达一分钟的视频,并保持视觉质量;而谷歌发布 Gemini 1.5 Pro 大模型,可支持超长文本上下文推理,并且多模态能力表现优异,可精确捕捉电影视频细节。我们认为在 OpenAI、谷歌的引领下,有望开启多模态大模型的新一轮浪潮。

世界波体育

控制面板

您好,欢迎到访网站!
  查看权限

最新留言

    返回顶部