开源证券:传媒行业周报:AI视频生成模型持续开源,关注游戏、综艺上新行业周报

  • 17
  • 约 2.83MB
  • 约 0页
  • 2025-05-11 发布
  • 0金币
  • 预览图可能不清晰,实际为下载为清晰文档
AI视频生成模型工具继续开源,积极布局多模态AI5月9日,腾讯正式推出基于混元视频生成大模型打造的全新开源多模态定制化视频生成工具HunyuanCustom,其融合了文本、图像、音频、视频等多模态输入,能实现单、多主体视频生成及单主体视频配音、视频局部编辑等能力。此前大部分视频生成模型主要能实现文、图生视频,其中文生视频每次均需根据文本提示词重新生成,难以持续保持人物和场景的一致性,而图像生成视频模型主要实现“让图片动起来”,HunyuanCustom则通过引入身份增强机制和多模态融合模块,真正实现“图像提供身份,文本定义一切”,生成的视频在可控性、一致性、质量方面表现突出,用户只需上传一张或多张包含目标人物或物体的图片,并提供文本描述,便能识别出图片中的身份信息,并在完全不同的动作、服饰与场景中生成连贯自然的视频内容,此外还具备强大的音视频扩展能力,可满足视频创作者、短视频博主、电商从业者、广告创意人等不同用户和场景的需求,或在AI创作、电商、广告、游戏、教育领域得到广泛运用。此外,5月7日,海外公司Lightricks亦发布了开源视频生成模型LTXV-Video-13B,在多尺度渲...

开源证券:传媒行业周报:AI视频生成模型持续开源,关注游戏、综艺上新行业周报.pdf

  1. 1、本文档共0页,其中可免费阅读0页,需付费后方可阅读剩余内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。

相关文档

相关热门