hao86下载站：值得大家信赖的游戏下载站！

手机版
设为首页
网站导航

热门推荐

学习教育

占卜抽签

查看更多

首页手游下载软件下载行业资讯软件教程专题合集区块链

首页 > 区块链 > 大模型微调非得依赖人类数据吗？DeepMind：用带反馈的自训练更好

大模型微调非得依赖人类数据吗？DeepMind：用带反馈的自训练更好

时间：2023-12-26 13:09:00

来源：hao86下载

区块链

【#区块链# #大模型微调非得依赖人类数据吗？DeepMind：用带反馈的自训练更好#】

面对当前微调大模型主要依赖人类生成数据的普遍做法，谷歌 DeepMind 探索出了一种减少这种依赖的更高效方法。

原文来源：机器之心

图片来源：由无界 AI生成

如你我所见，大语言模型（LLM）正在改变深度学习的格局，在生成人类质量的文本和解决各种语言任务方面展现出了卓越的能力。虽然业界通过对人类收集的数据进行监督微调进一步提升了在具体任务上的性能，但获取高质量人类数据却面临着重大瓶颈。这对于要解决复杂问题的任务来说尤为明显，需要大量资源和专业知识。

怎么解决呢？模型生成得合成数据是一种有潜力的替代方案，只要能保证数据的质量，就能实现可扩展性和成本效益。

虽然 LLM 能够自我评估生成的数据，但在本文中，谷歌 DeepMind 探索了一种更简单的设置，将外部标量反馈信号用作每个生成样本的质量指标。

论文地址：https://arxiv.org/pdf/2312.06585.pdf

为了研究在模型生成数据上的训练，研究者考虑了一种简单但强大的语言模型自训练方法，仅需要两项功能，一是基于模型生成样本，二是利用评分机制对这些样本进行评估。

为了确保清晰度和一致性，研究者采用了一种强化自训练方法 ReST^

小编推荐下载

用剑的忍者动作冒险
带呗带手版购物优惠
模型大师益智休闲
反馈系统学习工具
三二一大数据购物优惠
军事模型 FPS射击
愤怒的僵尸数据益智休闲
完整的记忆训练益智休闲

相关推荐

相关文章

更多>>

大模型微调非得依赖人类数据吗？DeepMind：用带反馈的自训练更好 12-26

面对当前微调大模型主要依赖人类生成数据的普遍做法，谷歌DeepMind探索出了一种减少这种依赖的更高效方法。原文来源：机器之心图片来源：由无界AI生成如你我所见，大语言模型（LLM）正在改变深度学习的格局，在生成人类质量的文本和解决各种语言任务方面展现出了卓越的能力。虽然业界通过对人类收集的数据进行监督微调进一步提升了在具体任务上的性能，但获取高质量...

用大模型训练实体机器人，谷歌推出机器人代理模型 01-25

原文来源：AIGC开放社区图片来源：由无界AI生成谷歌DeepMind的研究人员推出了一款，通过视觉语言模型进行场景理解，并使用大语言模型来发出指令控制实体机器人的模型——AutoRT。 AutoRT可有效地推理自主权和安全性，并扩大实体机器人学习的数据收集规模。在实验中，AutoRT指导超过20个实体机器人执行指令，并通过远程操作和自主机器人策略收集...

让大模型忘掉隐私数据，卡内基开源TOFU 01-19

原文来源：AIGC开放社区图片来源：由无界AI生成目前，多数大语言模型都是从网络上收集的大量数据进行预训练、微调。使得这些模型面临泄露用户隐私、数据安全等多种问题。尽管开发者提出了各种“遗忘”方法，能使大模型“忘记”训练数据中的某些隐私、敏感的数据。但很多方法非常有限，同时缺少有效的数据评估集。因此，卡内基梅隆大学的研究人员提出了TOFU框架，包含...

宇宙的尽头是带货，大模型首战在营销 01-16

图片来源：由无界AI生成最近网上流行一句话：宇宙的尽头是带货。简单来说，就是以前那套“羊毛出在猪身上”的变现方式即内容向观众和粉丝免费、靠品牌主广告主付费，已经不好用了。企业“花钱赚吆喝”的品宣预算减少，而是更看重品效合一，希望将“有效流量”转化成实际的业绩增长。所以越来越多的网红博主、大V甚至某些新闻当事人，最后都走向了“带货”。精准、高效、低成本...

大干快上，大模型加速数据中心行业洗牌 12-20

原文来源：钛媒体作者：张帅图片来源：由无界AI生成大模型，是数据中心产业十年一遇的变革。相比于以GPT为代表的大模型带来的现象级热度，数据中心产业太不「性感」了。长久以来，数据中心产业较为成熟，但是重资产、长周期、年折旧额高的属性，注定了它不是一门互联网式的快生意，也缺少激动人心的故事。但不论是互联网，还是如今的大模型，数字世界都得依靠物理基础。...

字节多模态大模型PixelLM：高效像素级推理，无需依赖SAM 12-28

原文来源：量子位图片来源：由无界AI‌生成多模态大模型爆发，准备好进入图像编辑、自动驾驶和机器人技术等细粒度任务中实际应用了吗？目前大多数模型的能力还是局限于生成对整体图像或特定区域的文本描述，在像素级理解方面的能力（例如物体分割）相对有限。针对这个问题，一些工作开始探索借助多模态大模型来处理用户的分割指令（例如，“请分割出图片中富含维生素C的水果...

用大模型读取你的想法，并转化成文本！恐怖的DeWave模型 01-04

原文来源：AIGC开放社区图片来源：由无界AI生成悉尼科技大学的科研人员，通过大语言模型、EEG（大脑活动检测工具）、脑机接口等技术，开发了一个可自动读取人类想法，并转化成文本的AI大模型——DeWave。 DeWave的使用方法非常简单，用户只需要戴上EEG，然后开启你的思维活动，DeWave就能将你的想法直接翻译成文本，就像现实版的《读心人》非常“...

大模型正在重构机器人，谷歌Deepmind这样定义具身智能的未来 01-06

文章来源：机器之心图片来源：由无界AI生成过去一年中，连连取得突破的大模型正在重塑机器人研究领域。在最先进的大模型成为具身机器人感知世界的「大脑」之后，机器人的进化速度取得了远超想象的进步。 7月，谷歌DeepMind宣布推出RT-2：全球第一个控制机器人的视觉-语言-动作（VLA）模型。只需要向对话一样下达命令，它就能在一堆图片中辨认出霉霉，送给...

资讯排行

同类软件下载

人类还有希望吗益智休闲
更好生活实用
更好的叹号杀手学习工具
人类的故事益智休闲
亮度微调学习工具
微调查生活实用
吗吗答通讯交友
51大数据办公效率
反应的过来吗动作冒险
带箭的朋友学习工具

热门标签

热门软件推荐

热门游戏推荐

回顶部

好86下载 - 手机版 - 网站首页 - 最新更新

好86下载为玩家提供最新手游，热门软件下载，最全游戏攻略，最新行业资讯，尽在好86下载！

免责说明：本站内容全部由好86下载从互联网搜集编辑整理而成，版权归原作者所有，如有侵权，请联系我们删除。

Copyright © 2005 - 2021 hao86.com All rights reserved. 好86 版权所有.湘ICP备2021020172号-1