大语言模型 post-training 的变迁，从 Large Language Model (LLM) 到 Large Reasoning Model (LRM)本周推荐论文：POST-TRAINING OF LARGE LANGUAGE MODELSPost-training，本质是在做一件事，即如何运用 LLM 的 pretrained knowledge 来解决实际任务，具体的方法如 supervised

发布时间: 2025-03-17 10:50:14

1分

数据加载中

关注推特

收听电报

2

1

0

大语言模型 post-training 的变迁，从 Large Language Model (LLM) 到 Large Reasoning Model (LRM)
本周推荐论文：POST-TRAINING OF LARGE LANGUAGE MODELS
Post-training，本质是在做一件事，即如何运用 LLM 的 pretrained knowledge 来解决实际任务，具体的方法如 supervised
时政
( twitter.com )

10小时前由马东锡 NLP 🇸🇪 提交

大语言模型 post-training 的变迁，从 Large Language Model (LLM) 到 Large Reasoning Model (LRM)

本周推荐论文：POST-TRAINING OF LARGE LANGUAGE MODELS

Post-training，本质是在做一件事，即如何运用 LLM 的 pretrained knowledge 来解决实际任务，具体的方法如 supervised fine-tuning（SFT）、instruction tuning 以及 reinforcement learning（RL）。

https://t.co/LDsp8jEt8M

点击图片查看原图

Markdown支持

评论加载中...

您可能感兴趣的：更多

1

2

1

1

一个主流大型语言模型（LLM）API 价格比较网站，原来很多白嫖模型是收费的啊。
IT技术
( llmpricecheck.com)

11个月前 • Geek • -- 点击 0 评论

2

2

1

1

这个修复 JSON 格式的库在大语言模型时代很有价值👍
IT技术
( twitter.com)

4个月前 • 宝玉 • -- 点击 0 评论

3

2

1

1

这是苹果对于 Apple Intelligence 背后技术的介绍视频，结合引用的的推文信息，他们的模型分成三层：
1. 本地模型
这部分包含语言模型和扩散模型，另外还有用来做 RAG 的 Semantic Index (语义索引)和 App Intents Toolbox（应用意图工具箱）。
其中语言模型是 3B…
IT技术
( twitter.com)

9个月前 • 宝玉 • -- 点击 • 下载视频 0 评论

00:06:19

4

2

1

1

吴恩达老师建议大家关注 AI 智能体工作流，可以大幅提升 AI 应用的性能，并且他们总结了一套智能体设计模式：
- 反思：让大语言模型对自己的结果检查改进
- 使用工具：让大语言模型调用外部工具，如网络搜索、代码执行等
- 规划：让大语言模型自己设计一个多步骤的计划来达成目标
-…
IT技术
( twitter.com)

1年前 • 宝玉 • -- 点击 0 评论

5

2

1

1

《各大语言模型 API 价格对比》价格有转换为人民币 (汇率 1SUD=7.22CNY)
IT技术
( blog.chs.pub)

11个月前 • Geek • -- 点击 0 评论

6

2

1

1

Andrej Karpathy 在YouTube上发布了一段新视频，时长3小时31分钟：
《深入探讨大型语言模型（LLM）如ChatGPT》
IT技术
( twitter.com)

1个月前 • 宝玉 • -- 点击 0 评论

7

2

1

1

Chrome 127 内置大模型已经来了，居然支持多语言，端上 AI 很快要普及了。
时政
( twitter.com)

9个月前 • Leo Xiang • -- 点击 0 评论

8

2

1

1

非常受用的分享，现在我每写一个 prompt 都会让大模型 "反思下自己的表现" "并给自己的表现打个分"，像极了一个 PUA 大师，但效果确实好。
智能体设计模式：
- 反思：让大语言模型对自己的结果检查改进；
- 使用工具：让大语言模型调用外部工具，如网络搜索、代码执行等；
-…
时政
( twitter.com)

11个月前 • Leo Xiang #Tencent • -- 点击 0 评论

9

2

1

1

推理规模扩展定律（inference scaling law）会成为大力出奇迹的新方向吗？它能带我们走进 AGI 吗？
在谈到大语言模型时，我们经常会联想到“大力出奇迹”，因为大语言模型正是靠着在“学习”方面的不断投入，用海量的数据和巨大算力训练出了像 GPT-4
IT技术
( twitter.com)

6个月前 • 宝玉 • -- 点击 0 评论

0.08275 Second , Gzip Enable.本网所有言论均来自网络，不代表本网站立场。联系方式: admin@bad.news

©2012.11.21 bad.news All rights reserved. 社区自动运营第 -- 年零 -- 天
This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.

关注推特