Magi：自动将漫画转录成文字并自动生成剧本Magi模型，由牛津大学工程科学系的视觉几何组开发。它可以全自动地为漫画页生成剧本，包括谁说了什么以及何时说的。还可以通过识别漫画页面上的面板、文字块和角色，以及将它们相互关联。Magi模型的主要功能包括：…

发布时间: 2024-03-11 22:42:42

1分

数据加载中

关注推特

收听电报

2

1

0

Magi：自动将漫画转录成文字并自动生成剧本
Magi模型，由牛津大学工程科学系的视觉几何组开发。
它可以全自动地为漫画页生成剧本，包括谁说了什么以及何时说的。
还可以通过识别漫画页面上的面板、文字块和角色，以及将它们相互关联。
Magi模型的主要功能包括：…
时政
( twitter.com )

9个月前由小互提交

Magi：自动将漫画转录成文字并自动生成剧本

Magi模型，由牛津大学工程科学系的视觉几何组开发。

它可以全自动地为漫画页生成剧本，包括谁说了什么以及何时说的。

还可以通过识别漫画页面上的面板、文字块和角色，以及将它们相互关联。

Magi模型的主要功能包括：

1、面板检测：识别漫画页面上的各个面板，即独立的画框，这是理解漫画布局的基础。

2、文本块检测：在漫画的各个面板中识别文本块，这些文本块通常包含对话或叙述性文本。

3、角色检测：识别页面上的角色形象，这对于将文本与说话的角色关联至关重要。

4、角色聚类：将检测到的角色按其身份进行聚类，以区分页面上不同的角色。

5、文本到说话者的关联：确定哪些文本是由页面上的哪个角色说出的，这是生成准确剧本的关键。

6、阅读顺序排序：将检测到的文本块按照漫画的阅读顺序进行排序，确保剧本的叙述逻辑与原漫画一致。

7、通过这些功能，Magi能够自动将漫画页面转化为详细的文字剧本，其中包含角色对话和相应的动作或情境描述，从而使读者能够通过阅读文本来完整地体验漫画故事。

GitHub：https://t.co/AIcmUVUJEJ

论文：https://t.co/fazBkfdFLb

模型：https://t.co/txaIbtSmXA

在线演示：https://t.co/f7e9og6sLj

Markdown支持

评论加载中...

您可能感兴趣的：更多

1

2

1

1

DomoAI：将你的照片和视频动漫化——只需要上传照片和视频，选择提示词和指定动漫风格，即可将你的照片和视频动漫化。支持：- 文字转图片：超过10种模型，专注于动漫和写实风格。- 图像转图像：图片转动漫、动漫转现实图片。- 图像到视频：从图片生成短动画。- 视频到视频：将视频转换成动漫风格
大陆资讯
( m.weibo.cn)

1年前 • 道知不 • -- 点击 0 评论

2

2

1

1

Runway 甚至可以生成带有文字动画的视频。文字相当稳定。
IT技术
( twitter.com)

6个月前 • 歸藏(guizang.ai) • -- 点击 • 下载视频 0 评论

00:00:10

3

2

1

1

notesGPT：开源的语音笔记GPT工具
它能够录下你的语音内容，然后自动帮助你把这些语音转成文字，对内容进行总结，并且生成相关的任务列表！
notesGPT的主要功能包括：
1. 录制语音笔记：用户可以直接通过该工具录制他们的语音笔记，无需手动输入文字，方便快捷。
2.…
IT技术
( twitter.com)

10个月前 • 小互 • -- 点击 • 下载视频 0 评论

00:00:33

4

2

1

1

3. 改写文本

转到（免费）并粘贴您的文本。

您的文本将在几秒钟内自动改写。
IT技术
( www.paraphraser.io)

1年前 • Will 3.6-6.16 硅谷 • -- 点击 • 下载视频 0 评论

00:00:19

5

2

1

1

法国摄影师、动画师Nicolas Monterrat将老照片转化成GIF动画
大陆资讯
( m.weibo.cn)

1年前 • 搞鸡啊 • -- 点击 0 评论

6

2

1

1

Readdit 上的一个帖子，很厉害，利用简陋的 3D 模型动画和 Animatediff 生成高度自定义的 2D 动画。
B 站前段时间胶囊计划有个片子也是类似的处理方式。
具体的工作流为：
将文本转化为3D效果: 由LumaLabs提供技术支持
背景设计: 使用ComfyUI和Photoshop的生成式填充功能
3D动画制作:…
IT技术
( twitter.com)

10个月前 • 歸藏 • -- 点击 • 下载视频 0 评论

00:00:30

7

2

1

1

Stability AI正式发布了他们从文字生成动画的工具Stable Animation，感觉效果和能力类似于Gen-1，主要包括下面三种能力。

文本到动画：用户输入文本提示（与 Stable Diffusion 一样）并调整…
IT技术
( twitter.com)

1年前 • 歸藏 • -- 点击 0 评论

8

2

1

1

这就是我想象中的具备实际生产力的应用场景：MJ生成图，PS辅助将图转为PNG可用素材，再用动画工具（AE）转成动画。这位大哥厉害！
IT技术
( twitter.com)

1年前 • Bear Liu • -- 点击 0 评论

9

2

1

1

怎么保持纸上写写画画的手感，同时体验数字化绘图板的方便？
#设计参考
Syncify Pro Set 用自带动作感应和红外线摄像头的数字笔，和有小点网格的纸张，捕捉你的动作，并在 iOS 和 Android 手机、平板上直接展示效果
再也不用忍受 iPad 画画的糟糕手感了
还能录屏和识别文字
IT技术
( twitter.com)

6个月前 • 倪爽 • -- 点击 • 下载视频 0 评论

00:00:09

0.24986 Second , Gzip Enable.本网所有言论均来自网络，不代表本网站立场。联系方式: admin@bad.news

©2012.11.21 bad.news All rights reserved. 社区自动运营第 -- 年零 -- 天
This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.

关注推特