使用下面的搜索规则,更精确:
例如: site:news.163.com author:老司机 saved:搜索自己收藏的内容
site:news.163.com author:老司机 saved:搜索自己收藏的内容
默认搜索标题...
预训练23年底就死了,只是这两个月才埋 微调24年q1也死了,只是还没有被埋 更是发现有些名词从前沿传到创投圈就被异化了词义: 大模型做teacher model教作为student的小模型,有人把这个过程叫做蒸馏,是完全错误的 teacher student的模型范式和蒸馏没关系 蒸馏也不是简单的做数据再训练 weak to strong learning才是核心
只需要几秒!
创建帐户
已拥有账号并想要登录?
登陆 忘记密码?