这个太重要了！更好地评估生成图像与文本提示词的匹配程度1）引入新标准：VQAScore，特别是在涉及属性、关系和推理的复杂文本提示等方面超过现有标准2）提供 VQA 模型：CLIP-FlanT5 ，在文生图/视频/3D评估中达到了最先进的 VQAScore3）新基准：GenAI-Bench

发布时间: 2024-04-11 07:40:16

1分

数据加载中

关注推特

收听电报

这个太重要了！更好地评估生成图像与文本提示词的匹配程度
1）引入新标准：VQAScore，特别是在涉及属性、关系和推理的复杂文本提示等方面超过现有标准
2）提供 VQA 模型：CLIP-FlanT5 ，在文生图/视频/3D评估中达到了最先进的 VQAScore
3）新基准：GenAI-Bench
时政
( linzhiqiu.github.io )

9个月前由 -Zho- 提交

点击图片查看原图

Markdown支持

评论加载中...

您可能感兴趣的：更多

这太疯狂了。
Luma AI 刚刚推出了 Dream Machine，它可以从文本和图像生成 AI 视频。
与 Sora 不同，它今天向公众开放。
质量太疯狂了。
1.

IT技术
( twitter.com)

7个月前 • Will • -- 点击 • 下载视频 0 评论

00:00:29

wow！又一重要研究！
SLD（基于 LLM 控制的自我矫正扩散模型）：
无需训练，就可实现对任意图像的自动编辑，还能自动修复任何生成模型（如 DALLE3 或 SDXL）文本与图像的错位
项目地址：
论文地址：
时政
( twitter.com)

10个月前 • -Zho- • -- 点击 0 评论

#AI开源项目推荐：AnimateDiff

这是一个高效框架，能进一步将生成的静态图像生成动画。

项目摘要

随着像 Stable Diffusion 这样的文本转图像模型及 LoRA 和 DreamBooth…
IT技术
( twitter.com)

1年前 • 宝玉 • -- 点击 • 下载视频 0 评论

00:00:13

一款可以将文本转换为知识图谱的工具：Prettygraph
特点：
1、文生图：可以将用户输入的文本转换为知识图谱
2、动态 UI 更新：图表会在每次插入句点时重新生成，并在 UI 中实时更新，从而提供交互式体验
3、颜色编码可视化：图中的节点和边采用颜色编码，以更好地进行视觉区分…
时政
( twitter.com)

8个月前 • AIGCLINK • -- 点击 0 评论

又一个电商产品场景图生成工具，提供了一系列装饰元素的线稿图，相比之前的工具有可以进行更好的自定义，只需拖动元素线稿图就能轻松搭配出想要的场景。同时也可以通过文本提示词进行场景生成。

IT技术
( fotographer.ai)

1年前 • sundyme • -- 点击 • 下载视频 0 评论

00:00:34

让Code Interpreter做一个更难的任务，虽然失败，但有些新发现。

任务要求：把右边尼尔森的10大设计原则，提出文本并翻译成中英对照Markdown表格，基于原图做一个中文版图片。

只完成了OCR识别提炼文本，也做了…
IT技术
( twitter.com)

1年前 • 向阳乔木 • -- 点击 0 评论

为什么要把图片反向解释成为 prompt

从文字生成图片、从图片生成图片都很常见，这个工具反其道而行之：你提供图片，它用 AIGC 工具的标准输出对应的提示语

有了这些精确的提…
推特中文圈
( twitter.com)

1年前 • 倪爽 • -- 点击 0 评论

Large World Model (LWM)：百万Token通用世界大模型
该模型主要是让AI更好地理解和处理长视频和超长文本内容。
LWM在100万个令牌的上下文窗口中，能够高精度的检索信息，超过了GPT-4V和Gemini Pro。
它能够理解并回答超过一个小时的YouTube视频的问题。
还能根据文本提示自动生成图像和视频。…
IT技术
( twitter.com)

10个月前 • 小互 • -- 点击 • 下载视频 0 评论

00:00:45

参考了这个老哥怪异值的设置，我创建了一个类似于 Midjourney 风格化的命令，这个提示会让 DALL-E3 输出更加美观和更加艺术化的图片。

<---提示开始--->
另一个文本到图像的模型有一个名为 'Stylize'…
IT技术
( twitter.com)

1年前 • 歸藏 • -- 点击 0 评论

时政

这太疯狂了。 Luma AI 刚刚推出了 Dream Machine，它可以从文本和图像生成 AI 视频。 与 Sora 不同，它今天向公众开放。 质量太疯狂了。 1. IT技术 ( twitter.com)

IT技术

wow！又一重要研究！ SLD（基于 LLM 控制的自我矫正扩散模型）： 无需训练，就可实现对任意图像的自动编辑，还能自动修复任何生成模型（如 DALLE3 或 SDXL）文本与图像的错位 项目地址： 论文地址： 时政 ( twitter.com)

时政

#AI开源项目推荐：AnimateDiff 这是一个高效框架，能进一步将生成的静态图像生成动画。 项目摘要 随着像 Stable Diffusion 这样的文本转图像模型及 LoRA 和 DreamBooth… IT技术 ( twitter.com)

IT技术

时政

又一个电商产品场景图生成工具，提供了一系列装饰元素的线稿图，相比之前的工具有可以进行更好的自定义，只需拖动元素线稿图就能轻松搭配出想要的场景。同时也可以通过文本提示词进行场景生成。 IT技术 ( fotographer.ai)

IT技术

IT技术

为什么要把图片反向解释成为 prompt 从文字生成图片、从图片生成图片都很常见，这个工具反其道而行之：你提供图片，它用 AIGC 工具的标准输出对应的提示语 有了这些精确的提… 推特中文圈 ( twitter.com)

推特中文圈

IT技术

参考了这个老哥怪异值的设置，我创建了一个类似于 Midjourney 风格化的命令，这个提示会让 DALL-E3 输出更加美观和更加艺术化的图片。 <---提示开始---> 另一个文本到图像的模型有一个名为 'Stylize'… IT技术 ( twitter.com)

IT技术

创建一个新帐户

登录

这太疯狂了。
Luma AI 刚刚推出了 Dream Machine，它可以从文本和图像生成 AI 视频。
与 Sora 不同，它今天向公众开放。
质量太疯狂了。
1.

IT技术
( twitter.com)

wow！又一重要研究！
SLD（基于 LLM 控制的自我矫正扩散模型）：
无需训练，就可实现对任意图像的自动编辑，还能自动修复任何生成模型（如 DALLE3 或 SDXL）文本与图像的错位
项目地址：
论文地址：
时政
( twitter.com)

#AI开源项目推荐：AnimateDiff

这是一个高效框架，能进一步将生成的静态图像生成动画。

项目摘要

随着像 Stable Diffusion 这样的文本转图像模型及 LoRA 和 DreamBooth…
IT技术
( twitter.com)

又一个电商产品场景图生成工具，提供了一系列装饰元素的线稿图，相比之前的工具有可以进行更好的自定义，只需拖动元素线稿图就能轻松搭配出想要的场景。同时也可以通过文本提示词进行场景生成。

IT技术
( fotographer.ai)

为什么要把图片反向解释成为 prompt

从文字生成图片、从图片生成图片都很常见，这个工具反其道而行之：你提供图片，它用 AIGC 工具的标准输出对应的提示语

有了这些精确的提…
推特中文圈
( twitter.com)

参考了这个老哥怪异值的设置，我创建了一个类似于 Midjourney 风格化的命令，这个提示会让 DALL-E3 输出更加美观和更加艺术化的图片。

<---提示开始--->
另一个文本到图像的模型有一个名为 'Stylize'…
IT技术
( twitter.com)