阿里达摩院发布的 AnyText 看起来很不错呀,能生成与原图风格融为一体的文字,或者对原图中的文字进行修改,并且还能支持中文!
项目简介:
AnyText包括两个核心部分:一个是辅助的潜在特征模块,一个是文本嵌入模块。辅助的潜在特征模块使用文本字形、位置和蒙版图像这些输入,生成用于文本生成或编辑的潜在特征。文本嵌入模块使用一个OCR模型来将笔画数据编码为嵌入,这些嵌入与来自标记器的图像标题嵌入一起,生成能够与背景无缝集成的文本。我们为了增强书写的准确性,采用了文本控制扩散损失和文本感知损失作为训练方法。
项目地址:https://t.co/zaoU4Xmpct
演示地址:https://t.co/7jf86oOlse
论文:https://t.co/wCMIsT7sGT
点击图片查看原图
点击图片查看原图