AnyText是一款在线多语言视觉AI文本生成工具和编辑工具,利用最先进的 AI 技术将简单的文本输入转换为视觉上引人注目的图像,由阿里达摩院发布的文生图最新模型提供支持,目前可以可实现生成与原图风格融为一体的文字或对原图中的文字进行修改,并支持中文。该模型包括辅助的潜在特征模块和文本嵌入模块两个核心部分。
辅助的潜在特征模块利用文本字形、位置和蒙版图像等输入,生成用于文本生成或编辑的潜在特征。
文本嵌入模块使用OCR模型将笔画数据编码为嵌入,与来自标记器的图像标题嵌入结合,生成能够与背景无缝集成的文本。为提高书写准确性,采用了文本控制扩散损失和文本感知损失作为训练方法,欢迎在线体验!
请登录后发表评论
注册
停留在世界边缘,与之惜别