Newsletter
加入社群
输入邮箱,免费接收最新AI资讯、AI软件推荐
长时、高分辨率音频驱动人像动画生成模型
Hallo2 是一款基于音频输入的人像动画生成模型,能够根据单张图像和音频生成长达一小时的4K分辨率人像视频,视频中的人物表情和动作与音频同步。 使用场景及用户人群: Hallo2适用于各种需要生成人像动画的场景,例如: 虚拟主播: 为虚拟主播生成实时动画。 视频会议: 增强视频会议的体验。 教育: 制作教育视频。 娱乐: 制作动画短片。
产品优势和特点: 支持长达一小时的连续视频生成,保持视觉一致性。 支持高达4K分辨率的视频输出。 通过语音和文本标签的结合,实现高水平的可控性。 采用补丁丢弃和噪声增强技术,减少表情抖动和外观漂移。 使用向量量化和时间对齐技术,确保高分辨率视频的细节和时间一致性。
团队背景: Hallo2由复旦大学生成视觉实验室开发。