资讯

现有的方法大多依赖于预训练的视频扩散模型来生成关键帧之间的中间帧,但缺乏对人体3D几何结构的理解,导致在复杂的人体动作中产生不合理的结果。就像一个从未学过解剖学的画家试图画出人体动作,虽然整体看起来像那么回事,但细节处往往违背人体工程学原理。