大模型公司「卷」芯片英伟达危？

时间：2023-12-19 09:27:52

来源：hao86下载

区块链

人工智能的行业竞争，不仅是OpenAI与谷歌等各大互联网巨头的大模型之争，支撑运算的芯片赛道也暗流涌动，大模型“制造机”们也加入了赛道。

OpenAI计划从CEO Sam Altman投资的一家初创公司Rain AI订购更高效的NPU芯片；微软也推出两款自研芯片Azure Maia 100和Azure Cobalt 100；谷歌刚推出的新模型Gemini 1.0 采用的就是自己设计的芯片TPUs v4 和v5e。

在这之前，英伟达构筑的AI芯片帝国是这些大模型公司的强大输出方，如今，大模型公司试图要自给自足一部分。而正式向英伟达发起挑战，还是芯片赛道上的老玩家。

美国超威半导体公司（AMD）已推出新一代AI芯片MI300X，还从从英伟达手中分走了Meta、微软和OpenAI三大客户。

AI芯片卷起来了，但想要挑战坐在“王位”英伟达，也绝非易事。

大模型公司自给芯片

今年以来，各种AI大模型和应用百家争鸣，英伟达 A100、A800、H100、H800等能支持AI大模型训练的芯片被疯狂抢购。“消费者”不仅是科技公司，还有各国政府和风险投资公司。

“卖水”的英伟达一时风头无两，他们家的AI芯片供不应求，AI市场再现GPU短缺。

微软在 2023 财年报告中就多次指出，对能否为其云运营获取GPU感到担忧。OpenAI的CEO Sam Altman也不止一次公开“抱怨”芯片短缺及成本巨大，今年5月，他曾公开表示，OpenAI正在经历严重的算力短缺。这也正在影响用户体验，ChatGPT时常卡顿，反应延迟。

据报道，OpenAI 运行 ChatGPT 的成本每天在70 万美元。路透社指出，每个 ChatGPT 查询的成本约为 4 美分，如果此类查询增长到 Google 搜索的1/10，则需要预先投入价值约 480 亿美元的 GPU，每年需要花费 160 亿美元的芯片才能维持运行。

算力短缺，成本高昂，戴尔亚太和日本总裁 Peter Marrs 就曾预测，买家不会容忍英伟达GPU 的交货时间过长，这将给大量竞争对手制造机会。

为了摆脱对英伟达的芯片依赖，OpenAI 正在考虑研发自己的AI芯片，以应对全球GPU 的短缺，缩减GPT的训练成本。

前几天，OpenAI一份订购意向书曝光，Altman任职CEO期间，该公司承诺从一家初创公司Rain AI订购芯片，金额高达5100万美元，而Altman投资了这家公司。

值得一提的，这款芯片是基于神经拟态（Neuromorphic）技术的 “类脑” AI 芯片NPU，据说“模仿了人脑的结构和功能”，支持并行和分布式地处理信息，非常适合 AI 应用中的“计算密集型任务”，能够实现低耗、高效地处理信息。但目前，该芯片仍在研发阶段。

不仅是OpenAI，微软和Google等大型科技公司也在一直打造更高效的芯片。

11月16日，微软在年度IT专业人士和开发者大会Ignite上推出两款自研芯片——云端AI芯片微软Azure Maia 100、服务器CPU微软Azure Cobalt 100。

Maia 100旨在为AI工作负载运行基于云的训练和推理，而Cobalt 100则用于通用工作负载。微软的数据中心预计，将在2024年初同时采用Arm CPU和专用AI加速器。微软表示，除了在 Bing和 Office AI 产品上测试该芯片外，OpenAI也正在测试该芯片。

微软研发Maia 100 自用及供给合作伙伴OpenAI

谷歌也开始行动，其刚刚发布的、号称“吊打”GPT-4的大模型Gemini1.0，用的就是谷歌自研的TPUs v4 和 v5e芯片。

谷歌称，在TPUs上，Gemini的运行速度明显快于早期规模更小、性能更弱的模型。此外，歌还发布了TPU系统 Cloud TPU v5p，旨在为训练前沿 AI 模型提供支持，从而加速 Gemini 的开发。

包括苹果、华为等硬件厂商，越来越多的科技巨头都开始自主设计和开发自己的芯片，以满足自身的业务需求和差异化竞争。

英伟达的防御与扩张

大模型公司卷进芯片赛道，真能彻底摆脱对英伟达的依赖吗？

尽管市面上英伟达H100 GPU已涨到了原价的两倍，依旧供不应求。也即便已经上线自研芯片的谷歌，也依然在大量采购英伟达的芯片。

英伟达有自己的护城河。

据英国《金融时报》报道，今年以来，英伟达已经投资了二十多家公司，包括从价值数十亿美元的大型新人工智能平台到将人工智能应用于医疗保健或能源等行业的小型初创企业。

虽然英伟达表示，公司在投资时并没有特殊条款，也不要求被投企业必须使用英伟达的芯片。但某种程度上，这意味着更密切的关系。

英伟达风险投资部门 NVentures 的负责人 Mohamed Siddeek 表示：“对于英伟达来说，进行初创企业投资的首要标准是相关性。” 他强调，“使用我们的技术、依赖我们的技术、在我们的技术上建立业务的公司，我想不出我们投资的公司有哪家没有使用英伟达的产品。”

根据跟踪风险投资机构 Dealroom 的估计，英伟达在 2023 年参与了 35 笔交易，几乎是去年的六倍。Dealroom 指出，这是英伟达人工智能领域交易最活跃的一年，超过了Andreessen Horowitz 和红杉等硅谷大型风险投资公司。

此外，英伟达CUDA计算平台以及软硬件生态，也为英伟达护城河构筑了更加坚固的河堤。

CUDA是一种英伟达推出的并行计算架构，运行相同任务的情况下，支持CUDA系统的英伟达GPU比CPU的速度要快10到100倍。正是得益于CUDA系统，GPU才得以打败CPU，成为今天运行大数据计算的基础。

大模型公司自研芯片，摆在眼前的也困难并不少，根源是原材料的供不应求。

The Enderle Group首席分析师 Rob Enderle 就表示，“制造芯片并非易事，代工厂和晶圆厂已经饱和，这使得 OpenAI 的这项工作很可能会失败。”他补充说，“他们最好与 AMD、高通、英伟达或英特尔合作，因为后者已经拥有自己的铸造厂。”

还有成本。

Futurum Group的高级分析师Todd R. Weiss表示，创建自己的芯片摆脱依赖“乍一看，是一个很酷的主意”，但设计自己的芯片、建立自己的芯片制造设施，永无止境地开发更新更好的芯片路线图所需的成本，还要担心自己的供应链问题，“这并不比从他人手中购买芯片更简单。”

芯片的战场，还在芯片制造商之间。

12月6日，英伟达最大的竞争对手美国超威半导体公司（AMD）举行“Advancing AI”发布会，并拉来了微软、Meta等科技公司高管站台，发布会上，AMD带来了新一代AI芯片MI300X。

与英伟达的 H100 HGX 相比， MI300 X 加速器在运行大语言模型推理时的吞吐量和时延表现都要明显高出一截，且价格也更加低廉。Meta、微软和 OpenAI 公司随后在 AMD 投资者活动上表态，未来他们将会使用 AMD最新的AI芯片。

真正降低成本的办法，还得看芯片制造商的“互卷”。AMD、英伟达等芯片大厂进入产能竞争，价格才能打下来。而大模型巨头自研芯片，无非是为“军备竞赛”多一条奔跑的腿。

小编推荐下载

卷中卷购物优惠
危运宝生活实用
危废通生活实用
组合模型2 动作冒险
人体模型购物优惠
中国模型网购物优惠
危剑苍穹益智休闲
公司邦生活实用

相关推荐

更多>>

大模型公司「卷」芯片英伟达危？ 12-19

人工智能的行业竞争，不仅是OpenAI与谷歌等各大互联网巨头的大模型之争，支撑运算的芯片赛道也暗流涌动，大模型“制造机”们也加入了赛道。 OpenAI计划从CEOSamAltman投资的一家初创公司RainAI订购更高效的NPU芯片；微软也推出两款自研芯片AzureMaia100和AzureCobalt100；谷歌刚推出的新模型Gemini1.0 采用的就...

5000美元迭代百亿大模型，算力市场如何“卷”出新花样 01-11

原文来源：大模型之家作者：王昊达图片来源：由无界AI生成 2023年，Colossal-AI团队仅用85亿tokens、15小时和几百美元完成了对LLaMA-27B的性能优化。升级后的ChineseLLaMA-27B在多个基准评估测试中都有着更出色的表现。 2024年伊始，Colossal-AI在初始框架的基础上开启模型的下一轮迭代，利用250亿tok...

大模型内卷升级，国产大模型力争多模态高地 01-26

文章来源：大模型之家随着1月23日，多模态AI概念股午后拉升,昆仑万维涨超10%,三六零、拓尔思、云从科技、汤姆猫等跟涨。到了24日，多模态AI概念股整体上涨0.81%，主力资金流出7.98亿元。图源：网络根据2024年的表现来看，在多模态大模型领域，风险远高于机会。多数投资者更愿意在股票价格上涨时卖出，以锁定利润，同时也有可能会因担忧未来的不确定性...

性，谎言和大模型 01-17

原文来源：创业邦作者丨王艺编辑丨海腰图片来源：由无界AI生成想象一下，一个人将一串提示词输入大模型，大模型为他生成了一张穿着暴露的少女图片；他将这张图喂给了视频生成大模型，于是得到了一个该少女跳舞的视频。随后，他将该视频上传到了成人色情网站上，获得了超高的点击量和超额收益。再想象一下，一个黑客将一串带有特殊后缀的提示词输入到ChatGPT的对话框...

大模型赚钱4大流派，谁能赢？ 12-22

原文来源：鲸选社pro 作者：杨晓鹤图片来源：由无界AI生成 2023年，可能所有投资人都在问被投公司，“咱们能不能整个大模型？” 没有互联网公司想错过这波大模型热潮。在11月30日，ChatGPT迎来一周年之际，据百度CEO李彦宏先生所言，国内目前已经涌现了230多个大模型。最直接的吸引力，就是OpenAI公司估值疯涨到900多亿美金。每家公司都在跃...

聚焦教育场景的大模型，离真正的「教育专用大模型」还差多远？ 12-19

原文来源：多鲸作者：曹培杰黄宝忠图片来源：由无界AI生成回望2023年，ChatGPT横空出世，国内外公司纷纷推出自家大模型，加入混战，各种智能化教育产品也随之落地，AI+教育概念热度飙升。由于教育所独有的个性化、互动性需求，教育行业成大模型落地最通畅的场景之一。从通用大模型到教育专用大模型，从AI概念到实际产品，如何推动市场生态走向成熟？近日，中...

用大模型训练实体机器人，谷歌推出机器人代理模型 01-25

原文来源：AIGC开放社区图片来源：由无界AI生成谷歌DeepMind的研究人员推出了一款，通过视觉语言模型进行场景理解，并使用大语言模型来发出指令控制实体机器人的模型——AutoRT。 AutoRT可有效地推理自主权和安全性，并扩大实体机器人学习的数据收集规模。在实验中，AutoRT指导超过20个实体机器人执行指令，并通过远程操作和自主机器人策略收集...

大模型应用落地：兴奋，问题和最终解 12-21

原文来源：极客公园作者|宛辰编辑 |郑玄图片来源：由无界AI生成就在一年前的11月30日，ChatGPT发布的夜里，一位软件创业者不禁感慨：「过去20年白干了，我感觉全部都可以丢掉。」但技术的变化从来挡不住有人顺势而为地向前走。一年之后，已经有尝到大模型「甜头」的软件开发者「凡尔赛」起来：「做好了产品，客户不知道从哪就突然冒出来。」上半年所有人...

资讯排行

大模型公司「卷」 芯片 英伟达危？

大模型公司自给芯片

英伟达的防御与扩张

大模型公司「卷」芯片英伟达危？