标签：八类

AI版「女娲」来临！文字生成图像视频，八类任务一个模型搞定

传媒 • 2021年11月29日

近来，视觉合成任务备受关注。几天前英伟达的 GauGAN 刚刚上新了 2.0 版本，现在一个新视觉合成模型 Nwa（女娲）也火了。随着 VQ-VAE 这种离散化 VAE 方案的出现，高效和大规模的预训练被逐渐应用于视觉合成任务，例如 DALL-E（图像）、GODIVA（视频）。这