晚上测试用GPT4读图能力来理解Tiktok视频创意。操作步骤：① 按顺序上传截图，告诉GPT4这些图片出现在第几秒，总视频时长是多少秒。② 再给GPT一些额外背景信息，如视频介绍Text、Subtitle、用户评论等信息。③ 最后让GPT4分析这个视频流行的原因。关于关键帧截取：…

发布时间: 2023-11-12 02:40:35

1分

数据加载中

晚上测试用GPT4读图能力来理解Tiktok视频创意。
操作步骤：
① 按顺序上传截图，告诉GPT4这些图片出现在第几秒，总视频时长是多少秒。
② 再给GPT一些额外背景信息，如视频介绍Text、Subtitle、用户评论等信息。
③ 最后让GPT4分析这个视频流行的原因。
关于关键帧截取：…
IT技术
( twitter.com )

晚上测试用GPT4读图能力来理解Tiktok视频创意。

操作步骤：
① 按顺序上传截图，告诉GPT4这些图片出现在第几秒，总视频时长是多少秒。

② 再给GPT一些额外背景信息，如视频介绍Text、Subtitle、用户评论等信息。

③ 最后让GPT4分析这个视频流行的原因。

关于关键帧截取：
首帧、尾帧往往包含Hook、Call To Action信息，信息价值高。

中间部分可按总帧数均分、关键帧截取（内容显著变化帧，如剧情转折或动作发生）、目标检测截取。

测试时，人肉观察画面手动截取了3张图片，加上首尾帧，一共5张图发给GPT4。（上限10张）

其他输入项：
Subtitle：语音识别转成文本。
热门评论：评论区复制前五条留言。

发现GPT4真的可以比较好的识别画面内容，也能给出有一定意义的分析。
如不给截图，只把Subtitle发给GPT4分析，生成结果非常General。

这里漏掉了对声音的理解，还缺失对视频中物品、人物的发散联想、逻辑推理。

比如让GPT4分析“郭德纲讲英语”这个视频为什么火，难度很高。

AI需要先知道画面中的人是中国相声演员郭德纲，然后他竟然用英语讲相声，再从中发现有趣的地方，惊叹声音克隆技术的进步。

这一系列思考，对人来说，很容易，但对AI来说，可能就是巨大的挑战。很期待未来真正的多模态LLM。

Markdown支持

评论加载中...

您可能感兴趣的：更多

和昨晚做非完备逻辑推理测试，Claude+和GPT4是唯二的能猜到凶手的模型，谷歌的用英文测了不行，完全不理解要干嘛。
至于 Claude+和GPT4谁强呢？还是 GPT4，因为删除最后半句话后只有GPT4还能…
推特中文圈
( twitter.com)

1年前 • orange.ai • -- 点击 0 评论

Google Gemini AI模型官方测试视频（中文翻译）通过这个视频你可以全面的了解Gemini AI的能力！根据这个测试来看确实是很强大，进行了全方位的测试，从正常对话、视图能力、逻辑推理能力、语言翻译能、图像生成能力等都进行了各种测试演示。互联网的那点事的微博视频
大陆资讯
( m.weibo.cn)

1年前 • 风吹大奶两边倒 • -- 点击 0 评论

GPT4 的四个能力示例
- 画小人，对人体的结构理解和视觉能力
- 文字解谜，对空间的感知能力
- 对话分析，对人类对话的深度理解能力
- 代码解释，用自然语言推导代码运行结果
读过《千脑智能》的朋友应该还记得，人类的大脑里有一…
推特中文圈
( twitter.com)

1年前 • orange.ai • -- 点击 0 评论

studdy AI，一款AI教育软件，使用GPT4。

可以拍照解题、翻译，支持物理、生物、数学等不同学科。

每天有4次拍照对话机会。
AI Assistant对话好像可以用很多（能白嫖？），测试了十多条，还能问。
IT技术
( apps.apple.com)

1年前 • 向阳乔木 • -- 点击 0 评论

想起来还没用过Midjourney的融图功能（把2张图的内容合并到一起），测试了一下，思路挺合理。
时政
( twitter.com)

11个月前 • 阑夕 • -- 点击 0 评论

在对长文的处理上，ChatGPT 目前最强大的模型GPT4也打不过Claude+，我刚刚用洪灏的那篇最新研报做了几个测试：

-- 首先使用插件读取文章的链接，用同样的Prompt，没有一句总结到要点。

-- 其次复制全文给GP…
时政
( twitter.com)

1年前 • 偶像派作手 • -- 点击 0 评论

网上流传很广的Ikigai图，让人惊艳。

但仔细想，四个元素理论有6种组合方式，但图里只展示了4种，跟GPT4讨论，补齐了其他组合，以下是AI生成的解读：…
IT技术
( twitter.com)

1年前 • 向阳乔木 • -- 点击 0 评论

前两天一位新朋友用我的 Claude API 跑了一些对比 ChatGPT 3.5 和 GPT4 的测试，得出了一些非常有趣且令人惊喜的结论。
Claude 最新版的的综合能力已经超出了 ChatGPT 3.5 。
特别是数学推理…
推特中文圈
( twitter.com)

1年前 • orange.ai • -- 点击 0 评论

最近完善了下自己的中文模型能力评测集，包含如下部分：
指令遵循：参考ifeval 设计，考察模型遵守指令的能力，如结构化输出。
阅读理解：关注长上下文的阅读理解和回答能力。
长文本检索：将LLM作为rerank
代码生成：参考HumanEval 设计。
工具调用：目前只设计了单轮调用，不涉及plan和reflect。…
时政
( twitter.com)

8个月前 • 九原客 • -- 点击 0 评论

IT技术

和 昨晚做非完备逻辑推理测试，Claude+和GPT4是唯二的能猜到凶手的模型，谷歌的用英文测了不行，完全不理解要干嘛。 至于 Claude+和GPT4谁强呢？还是 GPT4，因为删除最后半句话后只有GPT4还能… 推特中文圈 ( twitter.com)

推特中文圈

大陆资讯

推特中文圈

studdy AI，一款AI教育软件，使用GPT4。 可以拍照解题、翻译，支持物理、生物、数学等不同学科。 每天有4次拍照对话机会。 AI Assistant对话好像可以用很多（能白嫖？），测试了十多条，还能问。 IT技术 ( apps.apple.com)

IT技术

想起来还没用过Midjourney的融图功能（把2张图的内容合并到一起），测试了一下，思路挺合理。 时政 ( twitter.com)

时政

在对长文的处理上，ChatGPT 目前最强大的模型GPT4也打不过Claude+，我刚刚用洪灏的那篇最新研报做了几个测试： -- 首先使用插件读取文章的链接，用同样的Prompt，没有一句总结到要点。 -- 其次复制全文给GP… 时政 ( twitter.com)

时政

网上流传很广的Ikigai图，让人惊艳。 但仔细想，四个元素理论有6种组合方式，但图里只展示了4种，跟GPT4讨论，补齐了其他组合，以下是AI生成的解读：… IT技术 ( twitter.com)

IT技术

前两天一位新朋友用我的 Claude API 跑了一些对比 ChatGPT 3.5 和 GPT4 的测试，得出了一些非常有趣且令人惊喜的结论。 Claude 最新版的的综合能力已经超出了 ChatGPT 3.5 。 特别是数学推理… 推特中文圈 ( twitter.com)

推特中文圈

时政

创建一个新帐户

登录

和昨晚做非完备逻辑推理测试，Claude+和GPT4是唯二的能猜到凶手的模型，谷歌的用英文测了不行，完全不理解要干嘛。
至于 Claude+和GPT4谁强呢？还是 GPT4，因为删除最后半句话后只有GPT4还能…
推特中文圈
( twitter.com)

studdy AI，一款AI教育软件，使用GPT4。

可以拍照解题、翻译，支持物理、生物、数学等不同学科。

每天有4次拍照对话机会。
AI Assistant对话好像可以用很多（能白嫖？），测试了十多条，还能问。
IT技术
( apps.apple.com)

想起来还没用过Midjourney的融图功能（把2张图的内容合并到一起），测试了一下，思路挺合理。
时政
( twitter.com)

在对长文的处理上，ChatGPT 目前最强大的模型GPT4也打不过Claude+，我刚刚用洪灏的那篇最新研报做了几个测试：

-- 首先使用插件读取文章的链接，用同样的Prompt，没有一句总结到要点。

-- 其次复制全文给GP…
时政
( twitter.com)

网上流传很广的Ikigai图，让人惊艳。

但仔细想，四个元素理论有6种组合方式，但图里只展示了4种，跟GPT4讨论，补齐了其他组合，以下是AI生成的解读：…
IT技术
( twitter.com)

前两天一位新朋友用我的 Claude API 跑了一些对比 ChatGPT 3.5 和 GPT4 的测试，得出了一些非常有趣且令人惊喜的结论。
Claude 最新版的的综合能力已经超出了 ChatGPT 3.5 。
特别是数学推理…
推特中文圈
( twitter.com)