OpenAI分享他们在RAG技术的最佳实践：客户需求：他们有大量文档（比如10万份），希望模型只基于这些文档进行知识检索。解决方案：1. 直接将PDF和docx文件嵌入，准确率是45%。2. 经过20次调优迭代，解决细节小Bug - 准确率到65%3.

发布时间: 2024-06-01 01:40:38

1分

数据加载中

关注推特

收听电报

2

1

0

OpenAI分享他们在RAG技术的最佳实践：
客户需求：他们有大量文档（比如10万份），希望模型只基于这些文档进行知识检索。
解决方案：
1. 直接将PDF和docx文件嵌入，准确率是45%。
2. 经过20次调优迭代，解决细节小Bug - 准确率到65%
3.
时政
( twitter.com )

7个月前由 Y11 提交

OpenAI分享他们在RAG技术的最佳实践：

客户需求：他们有大量文档（比如10万份），希望模型只基于这些文档进行知识检索。

解决方案：
1. 直接将PDF和docx文件嵌入，准确率是45%。

2. 经过20次调优迭代，解决细节小Bug - 准确率到65%

3. 基于规则进行优化，譬如先判断问题属于什么领域（退一步思考），然后再回答，效果提升到85%

4. 发现数据里有一些是结构化数据（如表格），为此定制提取解决，准确率提升到98%。

视频地址：https://t.co/3w1NMti0M5

点击图片查看原图

Markdown支持

评论加载中...

您可能感兴趣的：更多

1

2

1

1

论文推荐：模块化RAG（
可以理解为是对 RAG 最新的综述，基本覆盖了所有的 RAG 技术。
作者尝试用数学或者伪代码定义 RAG flow 倒是挺有意思。
小感想：RAG 等技术天然有缺陷，不要死磕，雕花雕不好就再等等，做之前想想 ROI。
时政
( arxiv.org)

3个月前 • 九原客 • -- 点击 0 评论

2

2

1

1

OpenAI 宣布将推出 OpenAI 学院，要为中低收入国家的开发者和组织提供 OpenAI 最新的工具和培训，帮助他们学习如何有效使用这些技术。AI 的真正力量不在于系统本身或抽象的技术，而是来自世界各地的人们找到新方法，利用这些技术解决社区面临的难题和挑战。
***
Sam 在美国国务院“通过 AI
IT技术
( twitter.com)

3个月前 • 宝玉 • -- 点击 • 下载视频 0 评论

00:02:05

3

2

1

1

推荐对照阅读：《朱啸虎讲了一个中国现实主义AIGC故事》
中国科技界针对大模型的态度已分裂成两股阵营。一股是技术信仰派，他们大多技术出身，认为应该像OpenAI一样信仰AGI、信仰scaling…
IT技术
( mp.weixin.qq.com)

10个月前 • 宝玉 • -- 点击 0 评论

4

2

1

1

OpenAI 刚刚分享了艺术家们用 Sora 制作的短片。他们太棒了。
7个疯狂的例子：
1、害羞的孩子——“Air Head”
一部关于气球人的短片
IT技术
( twitter.com)

9个月前 • Will • -- 点击 • 下载视频 0 评论

00:01:21

5

2

1

1

是时候公布这道题的答案了。正好分享一下我最近学习Prompt的一点心得：给GPTs时间思考。

这是OpenAI官方公布《GPT最佳实践》的一个章节“Give GPTs time to "think"”：…
IT技术
( twitter.com)

1年前 • 宝玉 • -- 点击 0 评论

6

2

1

1

转译：一种全新的 RAG 方法让文档理解更上一层楼
RAG 技术已经迅速成为在实际应用中部署大型语言模型（LLMs）的首选方式。但大部分现有技术仍面临一个局限：它们只能从文档中检索到一小段连续的文本，这限制了对整个文档上下文全面理解的能力。
现有一种创新方法，名为…
IT技术
( twitter.com)

11个月前 • 宝玉 • -- 点击 0 评论

7

2

1

1

超长上下文 LLM 与 RAG 技术，在文档问答场景下谁更强？我动手做了一个对比实验
结论：大模型长上下文对 RAG 技术就是降维打击。不期望大模型都达到 200K、2M 这种级别的上下文长度，但至少应该达到 32K、64K 的长度且保证模型质量不下降。长上下文可以极大的简化 RAG…
时政
( twitter.com)

9个月前 • heycc • -- 点击 0 评论

8

2

1

1

这张“RAG 技术现状”的图画的真好，不用怀疑，肯定是 excalidraw 画的。
IT技术
( twitter.com)

11个月前 • 宝玉 • -- 点击 0 评论

9

2

1

1

RAG 并没有大家想象得那么复杂，要对技术祛魅，本质上就是 3 个部分组成。
感谢把之前写的两篇关于 RAG 原理的文章整理了一下，这样图非常清晰！
IT技术
( devv.ai)

11个月前 • Jiayuan (Forrest) • -- 点击 0 评论

0.11986 Second , Gzip Enable.本网所有言论均来自网络，不代表本网站立场。联系方式: admin@bad.news

©2012.11.21 bad.news All rights reserved. 社区自动运营第 -- 年零 -- 天
This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.

关注推特