查看: 156|回复: 0

黄仁勋深度访谈:每周工作7天6点起床,60位高管都向我汇报

[复制链接]
发表于 2024-6-4 17:31:33|来自:中国广东 来自手机 | 显示全部楼层 |阅读模式
芯东西6月4日报道,在跨越2万亿美元市值、坐稳美股市值TOP3后,AI盘算巨头英伟达正以古迹般的速率,向市值突破3万亿美元、超越苹果市值的又一里程碑发起冲刺。
美东时间6月3日,英伟达股价涨4.9%,市值一夜大涨1320亿美元(折合约9564亿人民币),最新市值达2.83万亿美元。


▲截至美东时间6月3日收盘,英伟达是全球市值增幅第一的公司(图源:Companies Market Cap)


▲截至美东时间6月3日收盘全球市值TOP5榜单(图源:Companies Market Cap)
英伟达与苹果的市值差距仅剩0.15万亿美元。
在开始创业时,英伟达首创人兼CEO黄仁勋才29岁,脸上还有芳华痘,去见其他西装革履的企业家时会感到忐忑不安。
如今的黄仁勋已是游刃有余的科技圈顶级红人,周日刚在台北国际电脑展COMPUTEX上发表主题演讲,周一又通过长途连线参与Snowflake数据云峰会的CEO炉边谈话。
不久前,黄仁勋还与美国移动支付巨头Stripe CEO帕特里克·克里森(Patrick Collison)进行了一场企业家之间打开话匣子的深度对谈,不但畅聊自己曲折的成长史、与AMD董事长兼CEO苏姿丰的亲戚关系,而且点名夸奖Llama系列模型的重大意义和自己日常爱用的AI工具。
黄仁勋还大谈管理履历,包括60位高管怎样向他汇报、怎么安排日常工作、为何坚持不裁员,以及大家最关心的——这位兼具工作狂魔与魅力型领导者特质的创业者,当初怎样做出卓有远见的判断,带领英伟达2.8万人走向伟大的成功?
在这次对谈中,黄仁勋畅所欲言,分享了许多个人喜恶,比如他“每天都不开心”、“每年都对公司不满意”,讨厌“报告会议”,讨厌“电子表格”,但他不认为“最好的工作是那些不停带给你快乐的事情”,反而相当有奋斗的觉悟。
黄仁勋热衷于挑战困难,连送出的祝福都是“我祝你们经历大量的痛苦和磨难”。
“我曾经是个扫厕所的,现在我是公司CEO。”他说自己不喜欢解雇员工、不愿放弃任何一名员工的原因,是觉得自己能帮助他们进步,而且相信好员工是可以“折磨”出来的。
黄仁勋相信产品、公司和组织需要“爱和庇护”,这是他在英伟达内部的常用表达。
他是个工作狂,每周工作7天,一醒来就开始工作,不停干到睡觉,就连不工作时也满脑子想着工作,无时无刻不在思考公司的未来,每天都在确认自己的核心信心、确认自己分析公司战略时使用的第一性原理是否正确。
他以前5点起床,现在改成6点起床,是因为家里小狗6点才醒,吵醒小狗会令他感到内疚。
他觉得不积极主动参与AI就是在犯错误,平时他碰到一个题目就会扔给AI搜刮工具Perplexity问问答案,他不但想要让英伟达全部人都大量使用AI工具,还想把整个公司都变成一个巨大的AI。
他还懊悔没在十多年前CUDA发布时买英伟达的股票。当时增加大量成本的CUDA引发一场灾难,摧毁了英伟达原本拥有的十亿美元市场,导致英伟达市值降到大约10亿美元左右。


▲已往十年,英伟达总市值从93亿美元增长到28290亿美元
在管理上,黄仁勋很不喜欢跟高管进行一对一沟通。英伟达的领导团队有逾60人,都直接向黄仁勋汇报,每两周开一次集领会议。他认为这样的好处是信息平权,至少能在公司移除7个管理层级,60人能平等地同时吸收到黄仁勋提出的题目、想法和分析等信息。
在日常工作中,黄仁勋会尽大概在上班前做完自己的工作,然后把上班时间主要用在开会上,他讨厌报告会议,只参加能解决题目、提出新想法、有创造性的、真正推动事情发展的会议。
相比抢市场,他更想成为一个市场的创造者,去创造从未存在过的东西。
黄仁勋对英伟达的任务和未来机会笃信不疑。面对外界的质疑,他坚信是其他人错了,他们“不懂得欣赏我们所建立的东西”。
他还老生常谈地强调摩尔定律走到头了,CPU性能提升已经基本停止了,现在轮到英伟达加速盘算的时代。
黄仁勋认为ChatGPT、RLHF(人类反馈强化学习)、给模型融入人类价值观、盘算民主化是近几年的重要技能突破,“ChatGPT实现了盘算的民主化,而Llama实现了生成式AI的民主化”。
看向未来,他猜测如果盘算机行业以大约20%的速率增长,未来几年大概需要将大约两万亿美元的盘算机替换成GPU;未来十年,在新型数据中心AI工厂中生产token将变得屡见不鲜,建立在其产品基础上的产业价值大概有100万亿美元。
至于和AMD苏姿丰“表舅”“表外甥女”的亲戚关系,黄仁勋夸赞苏姿丰“非常了不起”,说AMD不是自己的竞争对手,大家都是一家人,并提到自己和苏姿丰没有一起长大,相互也不熟悉,直到苏姿丰在IBM工作时才相识。


▲资深财经媒体人、家族传承研究者吴佳晋整理的黄仁勋及苏姿丰的家族族谱
小时间并不熟悉的表亲两人,现在掌管着全球最大的两家GPU,很是神奇。
以下是对Stripe深度访谈的完整编译(为进步可读性,智东西调解了部分问答的顺序,并在不违反原意的前提下进行了一定的增删修改):
一、“我绝对是世界上最好的厕所清洁工”

帕特里克·克里森:我想先谈谈你最近在斯坦福大学的一次活动上说过的一句话。你说道,我希望你们经历充足剂量的痛苦和折磨。能请你具体解释一下这句话是什么意思吗?
黄仁勋:有句话说,你应该根据你的兴趣来选择你的职业。通常人们会把兴趣和幸福联系在一起。我认为这个观点不能说是错误的,但忽视了一些重要的因素。
原因在于,如果你想要做伟大的事情、建立伟大的公司,一定是很不容易的。你并不总是享受这个过程。创业的过程中,我并不是每天都喜欢我的工作,也不认为每天都让我感到快乐。同时,快乐也不一定是美好的一天的界说。我每天都不开心,我每年都对公司不满意,但我每一秒都爱这家公司。
我认为人们常常有这样的误解,认为最好的工作是那些不停带给你快乐的事情。我不认为这是正确的。你必须受苦。你必须奋斗。你必须努力。你必须去做艰难的事情,并努力解决困难,才能真正意识到自己所做的事情有多伟大。
没有什么伟大的事情是容易完成的。因此,我祝福你们能实现伟大的成就。这句话用我自己的说法就是,我祝你们经历大量的痛苦和磨难。
帕特里克·克里森:你的这种观念是在成长过程中渐渐形成的吗?还是说你是天生就有这种性格?
黄仁勋:我是移民出身,当我在1973年来到美国时,我才9岁。我哥哥还不到11岁。这是一个陌生的国度,确实很不容易。
我们的父母对我们很好,但我们并不富有。他们工作很努力,时至今日也是如此。他们辛勤工作,言传身教,让我们学会了许多生活的履历和教训。
我做过各种各样的工作。我们上的学校包括还要做许多杂活。我刚到美国时被送去了奥奈达浸信会学院(Oneida Baptist Institute)。这可和麻省理工学院不一样。都叫学院,但意思差别。这是差别类型的学院。
我的学校是寄宿制的,我是里头最小的孩子。其他孩子都得做重活,得在烟草农场工作。而我得到了相对轻松的工作。当他们离开之后,我得清洁全部的厕所。我从不觉得自己得到了轻松的工作,因为厕所实在是太脏了。但那是我的工作,所以我便完成了它。
然后我还做过许多其他的工作,在丹尼餐厅(Danny’s,美国连锁快餐店)的工作就是其中之一。我最初是个洗碗工,然后做清洁工,最后做服务员。我热爱我的每一份工作。我不能说全部工作都很舒畅。但我所做的统统,我都想做得很好。也许这是从一开始就根深蒂固的一个品质。但我敢保证,我绝对是世界上最好的厕所清洁工。
二、60位高管均向黄仁勋汇报,任何员工都没有信息特权

帕特里克·克里森:我们来谈谈现在的英伟达。你们的领导团队有多大,都直接向你汇报吗?
黄仁勋英伟达现在的领导团队有60多人,他们都向我汇报,是我的直接下属。这种做法是很少见的,但我觉得这是最好的做法。
起首,我认为在公司里,信息的流传是十分重要的。我认为员工在工作上的贡献,不应建立在获取某些信息的特权这一基础上。我不会做一对一沟通。我的员工团队也很大。我在公司内部分享信息时,基本上全部人都能同时收到。
这么做的原因就是,我认为我经手的这些信息不应该只有一两个人知道,比如公司目前面临的挑战,亟待解决的题目,未来发展的方向。全部员工都应该能够获取全部这种类型的信息。我很喜欢这种模式,大家的信息都是一致的,公司里没有任何信息方面的特权,大家都能对公司面临的题目建言献策。
我的员工会议一般每2周进行一次,60个人都要齐聚一堂。这些会议都是题目导向的。无论提出了什么题目,大家都会在同一时间处置惩罚这个题目,听到了题目为什么出现,为何选择这样的解决方案。这很能给员工赋能。我相信,当你给每个人平等的获取信息的机会时,这就能给员工赋能。这是第一点,利用信息给员工赋能。
第二点,如果CEO的直接下属是60人,那就能在公司里移除至少7个管理层级。当然了,这点不能不停推进到公司基层。因为越往下需要的管理也就越多。而如果你“不幸”成为了英伟达的高管,你就没那么需要他人的管理了。
帕特里克·克里森:我很少会支持传统的管理模式。但试想一下,一对一沟通能给员工很具体的引导,比如给他们分析目的、分析职业生涯的发展规划、给员工充足的反馈信息,告诉他们工作中有哪些题目。这些都是传统意义上的一对一沟通中会做的事情。那你是不是不会做这些事情,还是说你的做法不一样?
黄仁勋:这个题目很好。我就在会议现场做这些事情。我会在大家面前给你反馈。这点其实是特别重要的。起首,反馈就是一种学习。那为什么你应该成为唯一一个获取这些信息的人呢?你给我们创造了一个学习的机会,不论是犯了错误,还是犯蠢了。我们都应该从这个机会中学到点东西。
我会在大家面前分析某个题目,提出我自己的见解,这能帮助在场的全部人学会怎么分析题目。我认为一对一沟通的主要题目,就是它剥夺了其他人学习的机会。从错误中学习,特别是从他人的错误中学习,是最好的学习方式。
这就是为什么我们会做案例分析。我们就是要从他人的灾难和悲剧中学习知识。这但是我们最“喜闻乐见”的事情。我也反对英伟达的别的高管做一对一沟通。没有什么能比“老黄让我们这么做”,或者“某某高管让我们这么做”这类说法,更让我抓狂了。
三、不愿放弃任何一位员工,甘心将他们折磨到伟大

帕特里克·克里森:你曾告诉过我,你真的不喜欢解雇员工,你也确实很少这么做。能具体讲讲背后的原因吗?
黄仁勋:是的,我甘心帮你进步,也不愿放弃你。我曾经是个扫厕所的,现在我是公司的CEO。所以我也认为,你什么都能学会。我相信你能学会生活中的许多事情,你只是需要一个学习的机会。我有幸观察许多聪明人做事情的方式。我身边就有60个人。他们大概自己都没有意识到我在观察和学习,但其实不停都在向他们学习。
我不愿意放弃任何一个员工,因为我觉得我能帮助他们进步。我甘心不停折磨他们,直到他们做出伟大的成就。我认为真正相信自己团队的领导,都愿意将他们折磨到伟大。
通常情况下,他们都很接近了。别放弃,真的很接近。成功有时间会在某一天突然降临。有大概你昨天还没有那种感觉,突然有一天就悟了,一下就想明白了。你能想象,在成功前的谁人时刻放弃是什么感受吗?所以我不希望放弃,所以我就继续折磨我的员工。
四、每周工作7天:6点起床,全天开会

帕特里克·克里森:你工作和生活的平衡做得怎么样?
黄仁勋:那就取决于你问谁了。我认为我的工作生活平衡非常好。真的很棒。我尽大概多地工作。我醒来的那一刻就开始工作,不停干到睡觉的那一刻。我每周工作7天。当我不工作的时间,我也在想工作。当我工作的时间,我就专心投入。
我能坐在那儿看完一整场电影,但什么也不记得。因为我脑子里想的满是工作。但我的工作不是不是去解决具体的题目,而是在思考公司能成为什么,有没有我们可以做得更好的事情。我无时不刻不在设想公司的未来。
帕特里克·克里森:黄仁勋的一天是什么样的?
黄仁勋:我以前5点就起床了。现在我6点起床。这主要是因为我家的狗。不知道为什么6点就变成它们起床的时间。我倒是不介意吵醒其他人,但叫醒小狗让我感到内疚。这都快变成一个负担了。我都不能发出任何动静,因为它们能察觉到房子里的任何震动,这会吵醒它们。所以我就待在床上读书,直到6点钟。但是我脑子里也想着GPU。
帕特里克·克里森:一般来说,你一天要开多少次会议?
黄仁勋险些整天都在开会。我努力在正式上班前把我自己的工作做完,这样每天去上班的时间就主要在开会。我会选择对我真正重要的会议,尽量避免参加通例运营会议。因为我的公司里有许多了不起的人在做通例运营会议。
我们做CEO的应该是临时替补,应该处置惩罚其他人做不了或者没有做的事情。我参与的会议都是要可以真正推动事情发展的会议。我不会参加报告会议,也讨厌报告会议。我只会参加解决题目的会议,能提出新想法的会议,头脑风暴会议,有创造性的会议。那才是我会参加的会议。
我通常会主动调集这些会议。我非常努力地不让Outlook管理我的生活,而是有意识地决定想做什么,想处置惩罚什么事情。我尽量过有目的的生活,并据此管理我的时间。
五、不喜欢抢夺市占率,“0亿美元市场”才是好思路

帕特里克·克里森:你曾经用过一个词叫“0亿美元市场”。你说“0亿美元市场”是你最喜欢的市场。这句话是什么意思?
黄仁勋:退一步看,我们的目的,或者说险些全部人的目的都应该是去做一些从未有人做过的事情,这是非常困难的。如果你实现了这些事情,那就大概对世界做出真正的贡献。我会努力去做这些事情。如果有些事情以前从未被做过,也极其困难,那么这个市场的规模应该就是0亿美元。因为这件事以前从未被做过。
我甘心成为一个市场的创造者,也不愿做一个市场中的掠夺者。要去创造一些以前从未存在过的东西,而不是考虑怎么抢占市场份额。我不喜欢考虑市场份额,也不喜欢份额这个概念。Stripe就是凭空出现的,之前也没有类似的公司。“0亿美元市场”也是一种很好的思维方式,能帮助公司思考要怎么样做好创新。
帕特里克·克里森:我们公司的任务是让整个互联网行业的GDP增长。有许多人会关注“互联网行业的GDP”这个说法,但我认为“增长”是这个表述里最重要的部分。因为,正如你所指出的,我们不应该考虑已经发生的交易或者已经存在的业务。我们应该考虑哪些交易不存在,哪些业务不存在。世界的GDP大约是100万亿美元,但它不必只有100万亿美元。它可以是200万亿美元或1000万亿美元。
黄仁勋:这完全正确。而且,我们在未来几十年将要创造的大部分价值,很大概不会受到物理事物规律的限制。这是一个差别寻常的时代。
帕特里克·克里森:现在我们刚好谈到这个“0亿美元市场”的概念。如果我在英伟达,我带着一些项目提议来找你,大概涉及到数亿美元的资本支出,或者需要多年的投入,现在也没有客户需要这个产品,无法展示有什么需求。那你们在这些事情上的决策方式是不是凭直觉的呢?
黄仁勋:非常接近。这是一种直觉上的判断,或者说直觉提供了一个起始假设。但你必须通过逻辑推理来证明这个事情的可行性。对我来说,推理比电子表格更重要。我讨厌电子表格,因为你可以为所欲为地使用电子表格。你可以用电子表格制作任何你想要的图表,你只需要输入一些数字就行。
我更喜欢文字,因为文字展现了你的推理过程。我大概会问你,告诉我,你是怎样逻辑推理的?你的直觉是什么?你为什么相信这很重要?你为什么认为这很难?
我喜欢困难的事情,因为这需要很长时间来做。如果它需要很长时间来做,许多不那么坚定的人大概不会去做。如果它真的很难做,需要很长时间来做,那就需要一个非常坚固、专注和坚定的人去寻求这个目的。大概好几年都会在原地徘徊,没有人会注意到你。
六、CUDA的发布是一场灾难,但没有它也没有今天的英伟达

帕特里克·克里森:CUDA这个想法一开始是怎么来的呢?
黄仁勋:CUDA源自于两个想法。其中一个叫作加速盘算。英伟达开创了这个叫做加速盘算的概念。加速盘算就像是一个I/O(输入/输出)设备,如果你在盘算机行业,它是一个你放在PCIe上的I/O设备,允许应用程序以加速盘算的方式与I/O设备交互。
UDA(Unified Driver Architecture,同一驱动架构)是在1993年发明的,它是一个影响深远的发明。它允许软件程序员直接编程I/O设备,直接给I/O设备写应用程序。这是因为I/O设备是虚拟化的,并且多代之间在架构上是兼容的。
总之,我们发明了这个叫做加速盘算的概念,我们称它为UDA。然后几年后,我们认为我们可以使我们的GPU对高级编程语言更具可编程性。所以我们发布了CG(C for Graphics),也就是为GPU编程设计的高级着色器语言。但由于种种题目,最终发布了CUDA(Compute with Unified Driver Architecture)。总之是个非常曲折的故事。
帕特里克·克里森:我想真正的题目是,CUDA有没有一夜爆火呢?
黄仁勋:不是的。CUDA的发布可以说是一场灾难。虽然我们寻求的是一个“0亿美元市场”,但寻求这个市场的成本太高了。它实际上摧毁了我们原本拥有的十亿美元市场。原因是因为我们的芯片中加入了CUDA,增加了大量成本,但是没有应用。没有应用,客户就不会重视这个产品,他们不会为此支付溢价。如果人们不愿支付,而你的成本上升了,那么你的毛利率就会受到挤压,我们的市值就会下降,然后真的变得非常低。我想我们的市值降到了大约10亿美元左右。我真希望我当时买了自家的股票。
帕特里克·克里森:所以你们需要取消CUDA,然后回到原来的战略吗?
黄仁勋:不是的,我不停相信CUDA。因为我已经推理过了。我们真的相信加速盘算能够解决普通盘算机无法解决的题目。如果我们想将架构扩展得更加通用,我们就必须做出这个捐躯。
我深深地相信我们公司的任务,相信公司未来的机会。我也坚信其他人都错了,他们只是不懂得欣赏我们所建立的东西。我深深地相信这些东西。
帕特里克·克里森:那你要怎样回应分析师、董事会和员工的质疑呢?你摧毁了这个现有的收入流,炒作了一个雄伟的梦想,但好像没有人真的想要。生意也变得很糟糕。你要怎么办呢?
黄仁勋:我只需要告诉他们,其他人都太笨了,否认现实就行(笑)。这是玩笑话,我们还是得回归到自己相信的东西上。
帕特里克·克里森:董事会在这期间有给你压力吗?
黄仁勋:我每次和他们对话都是从我自己笃信不疑的事情谈起。他们也确实相信我的说法,因为他们看到我自己笃信不疑。我也向他们推理分析了这些题目。要让他们相信,必须依赖推理。
帕特里克·克里森:CUDA最终的成功花了多久呢?
黄仁勋:大概10年吧。没有那么长。10年而已嘛,一下子就已往了。
帕特里克·克里森:不到你任期的三分之一。
黄仁勋:是的,时间过得很快。我险些不记得期间我经历的痛苦了。
帕特里克·克里森:英伟达没有CUDA,还能在AI领域取得今天的成功吗?
黄仁勋不,这是不大概的。这大概是当代盘算中最重要的发明之一。我们发明了这个叫做加速盘算的概念。这个想法很简单,但非常深刻。它的意思是一小部分代码占用了运行时间的99.999%。这对于许多非常重要的应用程序来说都是事实。而那几个核心可以被加速。CUDA不但仅是并行处置惩罚,没这么简单。这个想法的本质是我们可以加速那些核心和软件片段。
现在,当摩尔定律已经走到尽头,CPU的性能提升基本上已经停止了。如果我们不加速软件,就会面临盘算成本的膨胀。因为世界盘算量仍然在每年翻倍增长,如果CPU和通用盘算机的性能无法提升了,那么会发生什么呢?盘算成本将继续指数级上升。现在轮到我们去做盘算了。
七、怎样判断技能的远景?关键要做好刻意与固执间的平衡

帕特里克·克里森:在场的各位都是企业家,也许每个人自己心中都有和CUDA一样类似的愿景。他们认为这对他们的领域或他们的技能非常有意义,但市场还没有看到它的潜力。你认为有没有大概从中提取一些通用的原则呢?什么时间应该坚定地相信你的愿景,什么时间又需要重新考虑呢?
黄仁勋:是的,题目的关键是刻意与固执之间的界限。那条界限是模糊的。我每天都在确认我的核心信心。我现在仍然这样做。我需要确认我分析公司战略时使用的第一性原理是否正确。这不是一个很长的列表,很容易记住。
题目的关键是,这些原则现在是否有了根本性的改变呢?外部条件的变化是否使它们不再像以前那样重要?是不是有人解决了这个题目?这个题目现在已经消散了吗?是不是还会有需求?你必须不断检查。这是其一,不断自省。你必须非常小心地提炼基本原则,而不是说我就想这么做。这种想法就是固执了。我们不是5岁的孩子,所以你必须做好推理分析。
第二,必须要聪明一些。我们找到了一些方法将CUDA变现。我们到处寻找应用场景,找到了CT重建的应用,找到了地动信号处置惩罚的应用,找到了分子动力学的应用。我们不断地寻找应用场景。这些应用没有让我们大获成功,但至少足以让我们维持公司运转,为我们赢得了时间,让我们能撑到成功的时刻
八、未来大约2万亿美元的盘算机要换用GPU

帕特里克·克里森:让我们来谈谈AI。假设今天世界上全部GPU的总盘算能力是X。你认为,5年后我们的总算力会是X的多少倍?
黄仁勋:我要是说出来我肯定会后悔的。我们但是一个上市公司。你这个“疯子”,你们这种私有公司可真是自由自在。好的,让我们来分析一下。起首,世界已经安装了大约1万亿美元的数据中心。这些数据中心使用通用盘算。通用盘算已经没有未来了,所以我们不能再这样处置惩罚数据。世界需要加速盘算,需要将加速盘算应用到全部领域。当我们加速统统时,每一个数据中心、每一台盘算机都将是一个加速服务器。假设市场不增长,未来4年我们要替换大约1万亿美元的盘算机。
但如果盘算机行业继续以大约20%的速率增长,我们大概需要在未来几年将大约2万亿美元的盘算机替换成GPU。这是第一点。
第二点,这也是为什么我认为你们的行业潜力无限。这是一场工业革命,让我告诉你为什么。我们正在大量生产一些以前从未生产过的东西。生产这些东西需要一种以前从未存在过的设备,也就是GPU。我们现在首次大量生产的东西就是token和浮点数。这些东西的价值就在于它们代表着智能。这就是人工智能。
你可以将这些浮点数以某种方式重新组合,它就能变成英语、法语、卵白质结构、化学物质、图形、图像、视频、机器人的动作、方向盘的动作。我们正在以极大的规模生产token。我们在人工智能方面不断努力,最终发现了一种生产险些全部类型的token的方法。世界将生产大量的token。这些token将在新型数据中心中生产。我们称它们为AI工厂
回到上一次工业革命。水进入一台机器,把水烧开变成蒸汽,然后驱动发电机产生电力。原子进,电子出。而在这场新的工业革命中,是电子进,浮点出。上一次工业革命中,没有人明白为什么电这么有价值。而现在电力被出售、市场化。每千瓦时的电力被标上价格。现在token也被这么标上价格了,每1美元对应着多少token数。
就像上一次工业革命那样,这些事情对许多人来说都很难理解。但在未来10年这会变成人们屡见不鲜的事情。这些token将创造出新产品、新服务,进步整个行业的生产力。建立在我们产品基础上的产业,价值大概有100万亿美元。这个行业的远景是很广阔的。
帕特里克·克里森:这些token工厂的一个大题目是模型是否会饱和。我们现在可以用自然语言编写它们,将自然语言转换为SQL。从70亿参数的模型发展到700亿参数的模型,这种进步对于用户查询的准确性大概具有重大的改进。但或许发展到比这个规模还要大10倍的模型是不必要的?在某种程度上来说,目前的模型是不是已经充足好了,可以可靠地将自然语言转换为SQL?
你认为LLM(大语言模型)部署用例的饱和曲线是什么样的?什么样的用例才需要万亿参数模型或十万亿参数模型?还是说千亿参数的模型就够了?你对这个题目有什么看法吗?或者说我们能这么对待这个题目吗?
黄仁勋:好的,让我们把题目分解,然后推理一下。我们从一个例子开始。2012年,盘算机视觉领域的AlexNet,在ImageNet图像辨认的准确率大概是82%。在接下来的大概7年里,每年的偏差都淘汰了一半。这其实就是摩尔定律。每年的准确性进步了1倍,可信度也进步了1倍。在7年的时间里,它实现了超越人类水平的表现。
同样的事情也发生在语音辨认和自然语言理解上。这个行业将不断寻求更高的准确性和可信度。我相信在自然语言理解领域,我们也会看到类似的进步。当然,这些题目要复杂得多。但我坚信我们能将准确性每年进步一倍,直到它非常准确。目前在许多情况中,和模型交互时我们都感到答案很准确,值得信赖。在这种信任是尤为重要的。
第二点,目前的AI都是一次性生成内容的(one-shot)。但我们都知道,有许多事情是不能一次性就想明白的,需要不断迭代自己的想法。所以,我们要怎么样才能让AI也能够自己做好计划呢?怎么让AI自己构思一个解决题目的方法呢?
这大概需要工具,需要看一些版权数据,需要做研究,需要去问另一个Agent,需要问另一个AI,大概还需要人类的参与。比如问问人类的意见,发起某个事件,比如主动发邮件或者发消息给某人。然后才能进行计划的下一步。所以大语言模型必须学会规划并不断迭代计划。不能一次性就把事情都做好了。
当它做好计划时,还需要启动别的的模型一同互助解决题目。我认为未来的模型将会拥有自我迭代的能力,成为能利用其他具有特定技能的模型的计划模型。所以我认为我们还有很长的路要走。
九、ChatGPT实现了盘算民主化,Llama实现了生成式AI民主化

帕特里克·克里森:Meta因为发布Llama 3而备受关注。这好像是迄今为止最令人印象深刻的开源模型。你对开源模型有什么看法?
黄仁勋:如果你问我在已往几年中最重要的事件是什么,我会告诉你当然是ChatGPT的出现、基于人类反馈的强化学习,给模型融入人类价值观的相干技能。这些显然是重要的突破,当然还包括盘算的民主化。这使每个人都可以成为程序员。现在每个人都能用它做一些令人惊叹的事情。我真的为OpenAI的团队感到骄傲。
第二件事也同样重要。我认为是Llama。不是Llama 1,而是Llama 2。Llama 2让险些全部行业都开始研究使用生成式AI技能。它让各行各业都能够接触到这项技能,包括医疗健康、金融服务、制造、客户服务、零售等等行业。因为Llama 2和Llama 3是开源的,所以能吸引研究者、初创公司和别的行业使用这项技能。Llama系列模型普及了生成式AI。我认为这点也意义重大。
我认为ChatGPT实现了盘算的民主化,而Llama实现了生成式AI的民主化。没有Llama,很难实现目前和AI相干的安全研究、各种推理技能以及强化学习的研究。
十、空谈AGI何时实现意义不大,先界定题目才能解决题目

帕特里克·克里森:Dario Amodei(Anthropic公司CEO)两周前在Ezra Klein的播客上猜测AGI会在近期内实现。大概就是在未来几年内,比如2027年这个年份就经常被提及。你怎么看?
黄仁勋:这取决于你怎样界说AGI,起首,作为工程师,我们知道要先界定题目才能解决题目,必须以某种可权衡的方式表达题目和陈述任务。
如果说AGI的界说就是能完善通过我们目前的一系列基准测试,比如数学测试、英语理解测试、推理测试等等,还有医学考试、律师资格考试等等。不管你列出什么目的,我都相信我们将在非常短的时间内取得优异的成绩。如果那就是AGI的界说,我推测它很大概在未来5年内实现。因为目前模型在这些测试上,每半年错误率就能减半。我们没有理由不相信它不能很快实现超越人类的表现。
但是在座的各位要注意,这并不符合大多数人对AGI的想象。我从工程的角度这么界说AGI,只是为了我能回答这个题目。那如果AGI的界说尚不明晰,又怎么能回答这个题目呢?
十一、不积极主动参与AI是犯错,想把英伟达变成巨大的AI

帕特里克·克里森:在座的各位都是企业主。他们都面临着一个特别实际的题目,在你所描述的那种变化面前,一个人要怎么知道自己是否做出了恰当的、充分的、正确的反应呢?你有什么建议吗?
黄仁勋如果你不积极、主动地参与AI,那你就是在犯错误。你不会因为AI技能自己而赋闲,而是会因为使用AI的人赋闲。你的公司不会因为AI技能自己而倒闭,而是会因为另一家公司使用了AI而倒闭。这是毫无疑问的。因此,你必须尽快参与AI,这样你就能做那些你认为成本太高而无法做的事情。
如果智能的边际成本实际上接近于0,你就会去做许多你本来根本不大概做的事情。我们现在搜刮的频率,提问的频率都是特别高的。我平时碰到一个题目就扔到Perplexity里问问答案。即便有时间我已经知道答案,我也会问一下,以防万一。我们希望将这类行为的成本降到最低,这样大家便可以为所欲为地使用这些服务。
第二点,AI可以用来进步公司的生产力。生产力高的公司会带来更高的收入,而更高的收入会带来更多的就业机会。更多的就业机会则会带来更多的社会进步。因此,我们很有必要用AI推动公司生产力的提升。
帕特里克·克里森:除了影响你们的制造计划和资本支出计划之外,AI是怎样改变英伟达内部的运作方式的?
黄仁勋:我们是最早投资建设自有AI超算的科技公司之一。如果没有AI,我们就无法设计芯片。在夜间,我们的AI正在探索我们自己永远无法探索的种种大概的设计。因为要人工探索这些设计需要花费太多资金了。有了AI,我们的芯片变得更好了。我们能够降低我们芯片的能耗,性能也更好了。
如果没有AI,我们也无法编写软件。优化编译器的设计也十分复杂。我们会使用AI来提交错误报告。我们的错误数据库会告诉你代码出了什么题目,大概涉及哪些人,并让相干人员去修复它。
我想要英伟达的全部人都大量使用AI工具我还想把整个公司都变成一个巨大的AI。这样一定会很棒,那我就能做好工作和生活的平衡了。
帕特里克·克里森:你有没有听说过哪些企业,在意想不到的领域做出了一些意料之外的用例呢?
黄仁勋:我认为AI最大的惊喜的就是,当我们称之为大语言模型时,“语言”这个词包含的不只是人类的自然语言。如果AI模型能学会语言,那它也能学会操纵机器人的关节运动。这些本质上都是一些序列而已。我们只需要找到将这些操作token化的方式就可以了。其实对模型来说,统统都是可学习的。全部的这些专有编程语言,比如SQL、ABAP、Lightning、Verilog都是可学习的。这意味着我们能给地球上的全部工具都加上一个Copilot。
帕特里克·克里森:你认为未来是会有成千上万个单独的模型,还是只有一个万能的超大模型呢?
黄仁勋:我认为拥有一些超级模型来帮助我们进行通用推理是非常好的。但对于我们,对于那些拥有特定领域专业知识的公司来说,我们必须训练我们自己的模型。这么做是因为这类公司拥有一套自己专属的“语言”。而99%和99.3%之间的差别对我们来说就是生死攸关的区别。
专有模型对我们来说太有价值了。无论通用模型有多好,我们都需要进行微调和改进,直到它们能实现完善的表现。因为这些内容实在是太重要了。
十二、谈“表外甥女”苏姿丰:非常了不起,小时间不熟悉

帕特里克·克里森:时间快到了,但我还有许多题目没问。但有一些题目我真的很想问问答案。苏姿丰(AMD董事长兼CEO)是你的远房表亲吗?
黄仁勋:是的,她太棒了,非常了不起。顺便说一下,她是AMD的CEO。
帕特里克·克里森:AMD在GPU领域是你们的竞争对手之一。
黄仁勋:不,我们是一家人。我们都是这个行业的。我们还从AMD采购呢。
帕特里克·克里森:到底是怎么回事儿呢?为什么最大的两家GPU公司居然是由一家人运营的呢?
黄仁勋:我不知道这是怎么发生的。我们没有一起长大,相互也不熟悉。我们是在她在IBM工作的时间才熟悉的。她的职业生涯令人难以置信,真的非常了不起。
十三、硅谷创业文化剧变,现在没有芳华痘就没资格创业

帕特里克·克里森:你从90年代初就开始在硅谷摸爬滚打了,你认为硅谷文化在这段时间里发生了哪些变化呢?
黄仁勋:哇,我好久没想过这个题目了。有一点是,当我刚开始创业时,我才29岁,脸上还有芳华痘。当我去找律师事务所和风投公司时,我额头上还有一个大痘痘。那时间,作为一个年轻人,你会感到相当忐忑。那时间的大多数CEO都穿着西装,成就颇丰,举止言行都是大人的模样。他们用着一些大词,谈论着商业上的事情。创业者年轻的时间去见这些人会感到相当害怕,因为你被一群成年人包围着。
而现在,如果你脸上没有芳华痘,恐怕都没有创业的资格。这是一大变化。这一文化上的转变让年轻人也可以有所成就。年轻一代的CEO所知道的东西实在是太多了,而我学习这些知识花了几十年。
十四、带领2.8万员工逼近苹果市值,黄仁勋怎么做到的?

帕特里克·克里森:最后一个题目,英伟达的市值是2万多亿美元,现在你们离苹果和微软的市值只有一步之遥。我刚刚查了一下,他们分别有22万和16万名员工。而英伟达仅有2.8万名员工,还不到其中较小的一个的五分之一。我们刚才在后台聊天时,我记下了这一点,你可以通过流程实现卓越的运营,但只有资历才能实现卓越的工艺。英伟达比其他巨头要小得多。你们对员工的资历比较重视,能具体谈谈这一点吗?
黄仁勋:我认为卓越的运营可以创造出不错的东西,但仅通过卓越的运营无法创造出非凡的事物许多伟大的事物,比如你创造的产品、公司和组织,是需要爱和庇护的。你甚至无法用言语表达,怎么大概在电子邮件中把爱和庇护表达清楚呢?爱和庇护是无法融入商业流程中的。爱和庇护是我在英伟达内部很常用的表达。我必须使用这些表达,因为没有别的的说法。这些概念不能用数字来表示,也无法在产品规格中写出来。我们无法在产品规格说,要做出一些具有美感、工艺精湛的产品。
帕特里克·克里森:我在Stripe也总是在谈论工艺和美感。我希望事物具有这些难以言喻的特征,但其实它并不直接满足某些客户的需求。客户不会来找我们说,我希望产品更美。他们会说,我希望它具备特性X或特性Y。然而,我们相信工艺和美感真的很重要。你好像也这么认为。你为什么认为这些东西很重要呢?
黄仁勋:实际上,即便你的客户没有将这些需求说出来,但当他们真正使用这些产品后,他们就领会到了。毫无疑问,Stripe的产品具有美感,十分优雅简洁,简洁而不简单。简洁和简单不是一回事,它解决了题目,但恰如其分。它给你负担,但不会太多。找到这种平衡很难,我们无法具体说明,只能凭着直觉进步。
当我们渐渐培养出一支团队时,团队内部的感觉是基本一致的。其实我们已经将团队的感觉内化了,这些感觉是言语无法形容的。我们不想失去这些东西,而是想进一步发展这些特质。所以我不愿意重置,这也是为什么我不太愿意和新人一起工作。因为我已经习惯了这些东西,我已经与团队一同经历了如此多的痛苦和快乐,学习了许多的知识。全部这些履历已经内化到团队里了,而我想继续传承和发展这些东西。
这就是为什么我十分相信资历的力量正因如此,小团队也可以实现伟大的事情。和其他企业相比,英伟达就是一个小团队。我们只有2.8万人,但做出了远远超出我们体量的成就。
泉源:Stripe Sessions大会

来源:https://view.inews.qq.com/k/20240604A08IFZ00
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!
回复

使用道具 举报

发表回复

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /1 下一条

联系客服 关注微信 下载APP 返回顶部 返回列表