近日,专门从事合成数据技术的初创公司 Synthesis AI 宣布已经开发了一种生成式 AI Avatar 方案 "3D Generative AI",可以通过文本提示创建逼真的虚拟数字人。该技术将从今年第二季度开始提供给一组选定的测试人员。
该公司表示,3D Generative AI 使用了生成式 AI 和视觉效果管道,制作出高分辨率、高质量的虚拟数字人,可用于游戏、VR、电影和模拟等各种应用。
Synthesis AI 声称他们是第一家在如此高质量和细节水平上演示文本到 3D 数字人合成的公司。该技术允许用户输入所需数字人的文字描述,如年龄、性别、种族、发型和服装,然后系统会生成符合规格的 3D 模型。用户还可以通过更改文本提示或使用滑块来调整面部表情和照明等功能,以编辑 3D 模型。
该公司表示,3D Generative AI 是其更广泛使命的一部分,即通过提供完美标记的合成数据来训练机器学习(ML)模型来支持高级 AI 应用。合成数据是人工生成的数据,模仿真实数据,但不包含任何个人信息或敏感信息。
Synthesis AI 首席执行官兼创始人 Yashar Behzadi 表示:" 我们展示的 3D Generative AI 功能以编程、API 驱动的方法作为起点,添加了一个非常简单的基于提示的用户界面,并输出一个高分辨率的 3D 模型。"
通过 3D Generative AI,该公司设计了一种创新方法,利用 diffusion-based 生成式人工智能架构开发内部模型,以生成由性别、年龄、种族等关键参数控制的多种网格。纹理层是使用单独的生成模型创建的,该模型提供细粒度的独立控制。而通过合并这两个基本组件,系统可以生成一个完整的、高分辨率的 3D 模型。
Synthesis AI 的 Behzad 表示:" 招募特定个人和获得豁免的后勤工作使创建多样化的人类变得更加复杂。从廉价合成的数字人开始,比这两种选择中的任何一种都快且更便宜。3D Generative AI 功能可以按需生成高质量资产,为每个模型节省数周的时间和数千美元。"
3D Generative AI 引入了基于提示的输入和编辑,使所有经验水平的人都更容易使用无代码 3D 生成 AI 功能。
Synthesis AI 的专有库包含超过 10 万名数字人或 ID,是用于训练模型的基础数据。该公司的其他产品已经利用这个库来支持领先的计算机视觉团队,提供标记的训练数据,以支持面部识别功能、驾驶员监控、虚拟化身等的开发。