阿里智能研究院：推出的可控角色AI视频合成框架MIMO

AI快讯
9月27日

AISCK

MIMO 是阿里巴巴集团智能计算研究所推出的新型 AI 框架，用于可控角色视频合成。

它基于空间分解建模技术，将 2D 视频转换为 3D 空间代码，实现对角色、动作和场景的精确控制。

MIMO 的核心是将视频分解为主要人物、底层场景和浮动遮挡三部分，分别编码为身份代码、运动代码和场景代码，以此作为合成过程的控制信号，提高了合成视频的真实感和用户对视频内容的控制能力。

MIMO 主要有可控角色合成、动作控制、场景交互、空间分解建模、3D 感知合成、灵活的用户控制和任意角色的可扩展性等功能。

其技术原理包括 3D 深度估计，用单目深度估计器将 2D 视频帧转换成 3D 空间表示；空间分解为主要人物、底层场景和浮动遮挡三个空间组件；组件编码为身份代码、运动代码和场景代码；结构化运动表示用变形人体模型编码人物动作；规范身份表示将角色转换到规范姿势解耦身份和动作；场景和遮挡编码用共享变分自编码器编码场景和遮挡组件并重新组织为完整场景代码。

{{userData.name}}已认证

如何用AI将手绘素描图生成未来科技感高清概念图

机器人驾驶着未来概念汽车

赛博朋克风格的未来概念车/赛车

2025新年红装女孩元旦插图海报元素背景（AI绘画+Midjourney提示词）

红衣服女孩穿着喜庆贺新年（AI绘画+Midjourney提示词）

2025年春节新年元旦海报黑色背景喜庆矢量图海报设计（AI绘画+Midjourney提示词）

2025年新年日历牌元旦海报背景（AI绘画+Midjourney提示词）

阿里智能研究院：推出的可控角色AI视频合成框架MIMO

【限量款】2024龙年大吉微信红包封面

【精品AI进阶课】零基础快速学会高效运用AI

探索AIGC创作之美，共享人工智能学习之乐

欢迎来到 AISCK , 开启你的AI学习探索之旅 , 一起创造无限可能的精彩世界！

科学

优秀AI生成

品质素材！每日更新AIGC干货

AISCK

强烈推荐！AISCK官方品牌微博

AISCK

官方微博，海量教程看不完

AI基础训练营

零基础入门，带你成为AIGC高手

创造力

AIGC

抖音号：AISCK

AISCK·AI

抖音号：AISCK

知识

每天实训五分钟

一年萌新变大神

扫码关注AISCK

官方微信公众号

AISCK

AI前沿研究室

关于AISCK

产品服务

热门灵感

热门教程

{{userData.name}}已认证

如何用AI将手绘素描图生成未来科技感高清概念图

机器人驾驶着未来概念汽车

赛博朋克风格的未来概念车/赛车

2025新年红装女孩元旦插图海报元素背景（AI绘画+Midjourney提示词）

红衣服女孩穿着喜庆贺新年（AI绘画+Midjourney提示词）

2025年春节新年元旦海报黑色背景喜庆矢量图海报设计（AI绘画+Midjourney提示词）

2025年新年日历牌元旦海报背景（AI绘画+Midjourney提示词）

【限量款】2024龙年大吉微信红包封面

【精品AI进阶课】零基础快速学会高效运用AI

探索AIGC创作之美，共享人工智能学习之乐

欢迎来到 AISCK , 开启你的AI学习探索之旅 , 一起创造无限可能的精彩世界 ！

科学

优秀AI生成

品质素材！每日更新AIGC干货

AISCK

强烈推荐！AISCK官方品牌微博

AISCK

官方微博，海量教程看不完

AI基础训练营

零基础入门，带你成为AIGC高手

创造力

AIGC

抖音号：AISCK

AISCK·AI

抖音号：AISCK

知识

每天实训五分钟

一年萌新变大神

扫码关注AISCK

官方微信公众号

AISCK

AI前沿研究室

关于AISCK

产品服务

热门灵感

热门教程

欢迎来到 AISCK , 开启你的AI学习探索之旅 , 一起创造无限可能的精彩世界！