必一运动英伟达公司完全主导了人工智能软件芯片市场,其他公司也决定愿意采取设计自己的半导体的做法,这种做法往往是灾难性的。历史告诉我们,从头开始设计一款芯片需要数年时间,耗资数亿美元,而且通常会以失败告终。然而人工智能的前景是如此巨大,以至于人们决定必须尝试一下。
其中两个勇敢的灵魂是Mike Gunter和Reiner Pope。他们成立了一家名为 MatX 的公司,其目标是专门设计用于处理大型语言模型所需数据的芯片。LLM 是 OpenAI Inc. 的 ChatGPT 和 Google 的 Gemini 等技术的基础B-Sports,它们需要大量非常昂贵的芯片才能运行。如果一家公司能够制造出更便宜、更快、人工智能友好的芯片,那么它将在人工智能软件不断扩展的世界中表现出色。
Gunter 和 Pope 此前曾在 Alphabet Inc. 旗下的谷歌工作,Gunter 专注于设计运行人工智能软件的硬件(包括芯片),而 Pope 自己编写人工智能软件。谷歌多年来一直在打造自己的人工智能芯片,称为张量处理单元。不过,MatX 高管表示,这些芯片是在法学硕士真正开始起飞之前首次设计的,对于当前手头的任务来说过于通用。“我们试图让大型语言模型在谷歌运行得更快,并取得了一些进展B-Sports,但这有点困难,” Pope首次公开谈论他的公司时说道。“在谷歌内部,有很多人希望对芯片进行各种改变,但很难只关注LLM。出于这个原因,我们选择了离开B-Sports。”
Nvidia 在人工智能芯片市场上占据主导地位纯属偶然。该公司最初生产称为图形处理单元 (GPU) 的芯片,以加快视频游戏和某些计算机设计工作的速度。Nvidia 芯片擅长处理大量小型任务,而且碰巧的是,它们运行的人工智能软件在大约十年前开始起飞,比英特尔公司生产的其他类型芯片要好得多。
Nvidia 分割其 GPU 上的空间来处理各种计算工作,包括在芯片上移动数据。它的一些设计选择更多地迎合过去的计算时代,而不是人工智能的繁荣,并且会带来性能权衡。MatX 创始人认为,这种额外的空间增加了人工智能新时代不必要的成本和复杂性。它采用一种全新的方法,设计具有一个大型处理核心的芯片,其单一目的是尽快将数字相乘——这是LLM的核心任务。该公司打赌——这是一种孤注一掷的赌注——它的芯片在训练LLM和提供结果方面将比 Nvidia 的 GPU 至少好 10 倍。Pope 表示:“Nvidia 是一款非常强大的产品,显然适合大多数公司。” “但我们认为我们可以做得更好。”
MatX 已筹集 2500 万美元,最近一轮融资由人工智能投资组合 Nat Friedman 和 Daniel Gross 领投。该公司位于加利福尼亚州山景城,距离硅谷第一家晶体管工厂肖克利半导体实验室只有几英里,有数十名员工正在埋头研究该公司计划明年推出的芯片。“MatX 创始人象征着我们人工智能世界的趋势,”Gross说,因为他们采用了一些最大的公司开发的一些最好的想法,这些想法有点太缓慢和太官僚化, 并自行将它们商业化。
如果人工智能软件继续沿着目前的道路发展,它将对昂贵的计算产生巨大的需求。
据估计,每个正在开发的模型的训练成本约为 10 亿美元,其后续模型的训练成本预计为 100 亿美元。MatX 预测,通过赢得 OpenAI 和 Anthropic PBC 等多家主要人工智能公司的支持,它的业务将会蓬勃发展。“这些公司的经济状况与典型公司完全落后,”Gunter说。“他们把所有这些钱花在计算上,而不是工资上。如果情况不改变,他们就会没钱了。”
拥有丰富资源的公司——其中包括亚马逊、谷歌和微软——已经投资设计自己的用于人工智能工作的张量芯片。几年前,Groq Inc. 和 Cerebras Systems Inc. 等初创公司首次出现了人工智能专用芯片的浪潮。但这些产品是在人工智能重大技术突破导致LLM崛起成为人工智能领域的主流之前设计的。初创公司不得不适应人们对LLM突然产生的兴趣,并尝试即时调整他们的产品。MatX 很可能代表着又一波从头开始专注于LLM的芯片初创公司的开始。
进入芯片行业的一个巨大问题是设计和制造新芯片需要三到五年的时间。(当然,Nvidia 不会在这段时间停滞不前,事实上,本月宣布了其 GPU 的更快版本。)初创公司必须预测技术趋势和竞争将在哪里,几乎没有犯错的余地,这可能会减慢生产速度。软件公司通常必须重写代码才能在新的半导体上运行,这是一个成本高昂且耗时的过程,只有当他们期望通过转换获得巨大回报时,他们才会这样做。经验法则是,新芯片必须至少比之前的芯片好 10 倍,才有机会说服客户改变所有代码。
Gorss预测,我们正处于构建支持向人工智能转变为主要计算形式所需的基础设施的早期阶段。“我认为我们正在进入一个半导体周期,相比之下其他周期显得黯然失色,”他说。如果他是对的,那么几乎可以肯定还有新的芯片帝国有待创建。