ConsolidatedID具有多模式细粒度身份保留的肖像生成,是一个面部一致性生成项目,给定一些输入 ID 的图像可以仅使用单个图像,根据文本提示生成各种个性化 ID 图像,人像生成具有极高的ID保真度,不牺牲多样性、文本可控性,几秒钟内快速定制,无需额外的 LoRA 培训。ConsolidatedID 包含两个关键组件:一个多模态面部提示生成器,它结合了面部特征、相应的面部描述和整体面部上下文,以提高面部细节的精确度;以及通过面部注意力定位策略优化的 ID 保存网络,旨在保持 ID 一致性在面部区域。

ConsolidatedID多模式身份肖像生成 第5张插图