|
文 | 科技十点见
大概有25万人聚集在一起听萨蒂亚·纳德拉谈论人工智能。
这是5月的一个星期二。早上9点过后,微软首席执行官纳德拉正在为该公司在西雅图会展中心举行的年度Build开发者大会拉开序幕。与会者把全新的西雅图会展中心高楼塞得满满的,但他们远远不如那些在世界各地通过网络收看直播的人多。这样的盛况毫不意外。
几个月来,能以人性化的方式生成文本、图像和其他内容的生成式AI软件吸引了科技行业极大的关注。出人意料的是,微软正处于领先地位。
事实上,纳德拉今年主持了如此多的生成式人工智能产品发布会,以至于他在台上还特意停下来承认他们推出新产品的节奏之快。纳德拉身穿连帽衫和高帮球鞋,看上去非常像一个开发者。
这可能成为纳德拉已经非凡职业生涯的重要成就。纳德拉出生于印度海得拉巴,在21岁生日时来到美国学习计算机科学。他于1992年加入微软,成为一名Windows布道者,飞遍全国说服企业采用当时新的Windows NT操作系统。
纳德拉没有沉溺于过去的辉煌,而是鼓励整个组织对未知事物抱有谦虚的欣赏态度,追求云计算等新业务,并大胆收购LinkedIn和GitHub。在纳德拉就任首席执行官时,微软的市值还停滞在3000亿美元,但随后一路飙升至2.5万亿美元以上。
生成式AI可能是推动微软市值突破3万亿美元甚至更高的引擎,迄今为止,只有苹果公司的市值达到过3万亿美元。6月,麦肯锡发布了一份报告,估计生成式AI技术可以通过提高一系列流程的效率和效果,为全球经济每年增加2.6万亿至4.4万亿美元的价值。每个科技巨头,包括亚马逊、谷歌和Salesforce等微软的竞争对手们,都在竞相通过在其产品中植入以前不可能存在的功能来争取更多的市场份额。但微软凭借其为企业和消费者提供的庞大产品组合,在兑现这一承诺方面处于特别有利的地位。
但是,人工智能也可能是一个雷区。从传播错误信息的惊人能力到可能给就业市场带来的痛苦变化,这项技术势必会制造社会问题,而不仅仅是解决问题。
纳德拉在2017年的Build主题演讲中,在屏幕上闪现了《1984》和《美丽新世界》两本书的封面,作为技术潜在邪恶的象征,他从未回避面对人工智能的黑暗面。即使微软极力避免引发人工智能灾难,但纳德拉也清楚,其历史的下一阶段也不会轻松。“对于像我们这样已经取得了一些成功的大公司来说,转向新事物是非常困难的,”他告诉我。“而现在我要说,‘嘿,让我们去做这些雄心勃勃的人工智能的事情,并从每个人那里筹集资源和带宽。’”
和往常一样,他的语气平稳。但是,要征服技术的下一个前沿——在其他科技巨头之前——的潜在愿望是强烈的。这感觉很微软。“萨蒂亚想要赢,”90年代担任Microsoft高管,负责Windows、Internet Explorer和Office开发的Brad Silverberg说。“毫无疑问。”
“终极人机界面”
人工智能的研究可以追溯到1956年达特茅斯学院的一个研讨会,其目标是教计算机“解决现在只有人类才能解决的问题”。1991年,微软正式正式进军该领域,聘请了该领域的一些最聪明的人才来组建一个名为微软研究院的创新实验室。
然而,几十年来,AI的影响远远低于其雄心壮志。微软尤其以未能将其研究转化为重大的现实世界进步而闻名。“他们会谈论他们在机器翻译测试上达到了一个新的基准,某个晦涩难懂的数字,没有人明白那到底意味着什么。”Mary Jo Foley说,她从80年代就开始作为技术记者为咨询公司Directions on Microsoft撰写有关该公司的文章。
作为新任首席执行官,纳德拉试图展望微软的未来,他越来越相信,人工智能的突破使人们将通过类似聊天的体验与计算机进行越来越多的交互。正如他对我所说:“对话智能是终极的人机界面。”他开始采取具体措施,将这个想法推到公司待办事项清单的首位,包括在2016年将5000多名科学家、工程师和其他员工召集到一个新的人工智能和研究小组,并且人员规模在小组组建的第一年里就增加到8000名。然后,在2019年,他开始召集高层管理团队进行新的每周一次的会议,被称为“AI 365”,“确保我们思考最重要的主题并以正确的方式对其进行投资,”微软负责监督技术负责任使用的合作伙伴经理Sarah Bird莎拉·伯德(Sarah Bird)说。
这些举措并没有立即得到回报:纳德拉在2016年Build主题演讲中宣称“机器人是新的应用程序”,这远远超出了当时技术所能实现的目标。但他已明确表示,组织中的所有人都应共同努力,将AI研究转化为有用的产品功能,而这正是他们在做的。“我认为,萨蒂亚的亲力亲为在这方面最终变得非常重要。”微软研究与孵化公司副总裁Peter Lee说。
与此同时,竞争正在酝酿。2015年被任命为谷歌首席执行官后,Sundar Pichai在他的首份股东信中表示,该公司现在正进入一个“以AI为先”的世界。谷歌的研究人员发现通过摄取大量人类创造的文字材料,他们可以训练算法来惊人精确地猜测文本序列中的隐藏词。从那里,他们可以使用统计分析将至少在某种程度上有意义的新单词组合串在一起。“大语言模型”(LLM)的概念为纳德拉设想的对话智能提供了一丝诱人的曙光。
在技术进步的精神下,谷歌的科学家们分享了他们的发现,这些发现很快在整个行业中引起了反响。在其基础上建立的众多组织中有一个名为OpenAI的非营利组织。该公司成立于2015年,得到了LinkedIn创始人Reid Hoffman、Y Combinator联合创始人Jessica Livingston、Elon Musk和Peter Thiel等硅谷名人的支持,其目标是“以最有可能造福全人类的方式推进数字智能”,不受产生财务回报的需要的限制。”由于看到它是一个潜在的Azure云平台客户,微软给这家初创公司提供了一些免费计算时间的奖励。随着这些免费赠送奖励的减少,OpenAI开始将其工作量转移到谷歌云,似乎在关系真正启动之前就结束了与微软的关系。
OpenAI一直在利用其Azure积分教AI在名为Dota 2的多人在线游戏中竞争。(AI变得非常强,最终打败了人类世界冠军。)OpenAI还在开发一个名为GPT的LLM,代表“生成式预训练转换器”。其科学家们努力在数量越来越大的材料上训练这个模型,这有可能大大提高它可以生成的文本的连贯性和准确性。
纳德拉从一开始就对OpenAI的工作印象深刻,他说:“我通常对新事物感到兴奋。”但他知道他的意见只能说明那么多。在一次会议上与OpenAI首席执行官Sam Altman不期而遇并简短讨论了可能进行正式合作的可能性后,他要求Microsoft首席技术官Kevin Scott访问该公司并对GPT进行冷静的评估。
“我去的时候确实有点怀疑,”斯科特回忆道。“他们对未来的看法非常清晰,并有一些实验数据表明这不仅仅是关于未来的无根据的假设——确实发生了一些事情。”
尽管微软也在开发自己的LLM,代号为Project Turing(图灵计划),但斯科特立即看到GPT如何可以增强微软产品。2019年7月,微软承诺向OpenAI投资10亿美元。OpenAI获得了其未来LLM所需的计算基础设施;微软成为将它们商业化的首选合作伙伴。
不到一年后,OpenAI推出了GPT-3的工作版本,这是其LLM的第三个主要版本。它的局限性是显而易见的:它生成的书面文本有变成乱码的倾向。但它擅长以各种编程语言输出代码,尽管它并不是为此目的而设计的。考虑到微软拥有庞大的开发者客户群,而且它拥有领先的软件团队协作平台GitHub,这一事实是一个启示。
不到一年后,OpenAI开发了GPT-3的工作版本(working version),这是其LLM的第三个主要版本。它的局限性很明显:它生成的书面文本会逐渐变得没有意义。但它擅长用各种编程语言生成代码,即使它并非为此目的而设计的。考虑到微软庞大的开发人员客户群,以及它拥有GitHub,这是一个重大的发现。
当GitHub首席执行官Thomas Dohmke看到GPT-3的功能时,他对其代码的质量感到震惊。“当时的感觉就是,‘天啊——这真是太棒了,’”他说。“我以为它永远不会把括号放在正确的位置。”
GitHub和OpenAI开始开发一个工具,让软件工程师只需用简单的语言描述他们需要什么,就可以自动生成代码。即使结果需要进一步调整,也比从头开始编写每行代码节省了时间并减少了繁重的工作。
代码编写机器人的功能甚至超出了纳德拉的期望。当他第一次看到它时,他说,GPT改变工作的潜力“对我来说以切实的方式变得真实”。“该产品改变了生活。”它以GitHub Copilot为名,于2021年6月作为技术预览版上线,一年后正式发布。
OpenAI首席技术官Mira Murati表示,当开发人员欢迎这种由AI驱动的辅助形式时,“这是我们第一次让AI加入劳动力队伍,因为人们正在与Copilot合作来实际编写代码”。据GitHub称,Copilot客户现在使用该工具生成其编程项目中46%的代码。
“模型变得混乱”
在2022年夏末,微软高管在OpenAI工程师向他们展示了迄今为止最有能力的LLM的粗略版本时,又一次有了“天啊”的体验。它的代号为Davinci 3,生成的文本比前代流畅和准确得多。这正是可以迅速帮助实现纳德拉的“终极人机界面”的东西。
“我得告诉你,那一刻看到这东西以及它在做什么,真是难忘。”Charlie Bell说,他在亚马逊工作20多年后,于2021年9月加入微软,担任监管安全与合规的执行副总裁。“这是一个巨大的飞跃,我们将能够做什么以及我们将能够以多快的速度做它。”
次年1月,开始有报道称,微软向这家初创公司投资了100亿美元,以扩大双方的合作伙伴关系并确保优先使用OpenAI的技术。此后不久,微软开始发布融合GPT-4的产品,该模型以前称为Davinci 3。
第一个产品是New Bing,这款搜索引擎一直遥遥落后于Google。2月,在微软总部一个引人注目的发布会上,它推出了一个类似ChatGPT的机器人,可以理解并执行诸如“给我列出圣安东尼奥附近,6小时车程范围内的五个驾车旅行攻略”这样的请求,无需翻阅搜索结果。微软自己的人工智能层,被称为“普罗米修斯”,允许提供更多的当前信息(ChatGPT的数据集固定在2021年),并提供指向事实来源网站的引用链接。
但是,新的Bing也不能摆脱生成式AI技术的原始状态。即使以GPT-4和普“普罗米修斯”为核心,它也很容易让人产生“幻觉”——声称是事实的陈述,但实际上是虚构的,尽管听起来常常十分可信。更奇怪的是,你越像对待一个真正的人而不是一个没有感情的自动机器人那样对待它,它就越会以同样的方式回应你。它的回复可以冗长、哲学、阴谋论甚至有点戾气。
当被问及出错的原因时,微软高管谈到了科技记者特意进行的所谓的“对抗性攻击”。微软搜索和AI公司副总裁Jordi Ribas说,归根结底,该公司没有预料到AI的个性会如此鲜明:“模型感到困惑,它只是在概率上说了一些我们不希望它说的话。”
尽管Bing的异常行为让微软感到意外,但该公司已经为该机器人设计了即时调整的能力。它通过限制其回复的长度和一次会话中的交流次数来迅速将其控制住,这也减少了它产生”幻觉“的数量和过度程度。“这非常简单,”斯科特说。“实际上,只需不到一个小时的时间就可以对代码进行这两项更改,然后通过测试套件运行它,以确保它不会产生其他问题。”
新的Bing发布一个月后,Google推出了自己的搜索机器人Bard,据报道该机器人一直在实验室里进行测试,因为该公司担心任何它生成的错误可能带来的声誉风险。Bard比Bing更可控,但首次亮相也很不稳定,包括在Google自己的演示中错误地描述了有关詹姆斯·韦伯太空望远镜的事实。
最终,搜索大战似乎并没有发生根本性转变:根据市场调研机构Sametimeweb的数据,新Bing推出几个月后,其市场份额为3%,而谷歌则为91%。但事实上,人们开始谈论经常被忽视的Bing,这感觉就像是一种胜利。2月份,纳德拉给自己带来了一段自我满足的时刻,他接受The Verge主编Nilay Patel采访时说:“我想让人们知道,我们能让他们跳舞。”
“我们如何让人们的生活变得更加轻松?”
搜索可能仍然是微软的副业,但工作需要的生产力软件仍然是其核心。2022年,微软1980亿美元收入中近三分之一来自其所谓的“生产力和业务流程”部门。与LinkedIn和Dynamics 365(该公司的客户关系管理平台)一起,其中包括一套强大的产品,例如Word、Excel、PowerPoint和Teams(以前称为Office)。(去年,微软正式退役了这个品牌名称,取而代之的是容易被遗忘的Microsoft 365,但包括纳德拉在内的所有人都继续称其为Office。)然后是拥有全球超过10亿用户的Windows,,它隶属于一个被称为“更多个人计算”的590亿美元部门。
根据研究公司高德纳的数据,Microsoft 365占其市场份额约84%,完胜谷歌的Workspace。如果AI使微软获得更大的主导地位,它可能会招致来自美国司法部或其他监管机构的反垄断审查,这是微软以前遇到过的情况,从2001年具有里程碑意义的美国诉微软案,关于其搭售Windows和Internet Explorer,到最近将Teams与其365软件捆绑在一起的做法。另一方面,如果微软不全力投入AI,它可能会新暴露在竞争对手的威胁之下。
根据市场研究公司Gartner的数据,Microsoft 365占据了约84%的市场份额,彻底击败了Google的Workspace。如果AI推动微软获得更大的优势,它可能会引起美国司法部或其他监管机构的反垄断审查,这是微软之前也遇到过的情况,从2001年具有里程碑意义的美国诉微软案,该案涉及其捆绑Windows和Internet Explorer浏览器,到最近将Teams捆绑到其365软件中。但话又说回来,如果微软不全力投入人工智能领域,它可能会再次受到这样做的竞争对手的攻击。
许多微软产品已经深深地嵌入到许多组织中,如果AI使用得当,可能会产生类似于文字处理器和电子表格最初出现时所发生的变革。技术副总裁Brian Harry表示:“微软为我们提供的一个应用程序组合,使我们能够广泛思考在这里可以提供的经济价值。”他于1994年加入该公司,当时该公司收购了他的初创公司。“我们如何让人们的生活更轻松?”
生成式人工智能有可能解决一些由来已久的问题:微软产品的大部分功能都隐藏在菜单中,以至于没有人知道它们的存在。“对Office的批评之一是,‘你有很多功能,但我只使用了其中的5%,’”纳德拉承认。“除了每个人使用的5%不同。”自20世纪90年代以来,该公司一直在努力让其他95%的内容更容易被发现,当时它为Office提供了一个名为Clippy的会说话的回形针助手,但是也被认为是不受欢迎技术的典型。在纳德拉成为CEO后不久推出的另一款助手Cortana也无疾而终,而苹果的Siri和亚马逊的Alexa还在继续。
这一次,微软正在为其生产力应用程序和Windows配备自己的聊天机器人——利用公司自己的技术以及GPT-4。就像GitHub的代码生成器一样,他们将被称为Copilot。除了允许用户简单地通过描述来完成任务之外,这些机器人还可以访问所有业务数据,否则用户将不得不自己处理这些数据。纳德拉给出了一个示例请求:“‘你能从我的季度业绩开始并[写]一个脚本吗?’你瞧,它至少可以通过查阅组织中的所有文件来创建草稿。”
AI在商业中的潜力是巨大的。但是,客户对他们付费的关键任务软件中奇怪缺陷的容忍度将很低。他们还将要求微软确保信息安全。(微软称不会使用企业客户的数据来训练算法,也不会与OpenAI共享,而OpenAI已在7月成为联邦交易委员会消费者数据使用调查的对象。)
“你必须相信模型是好的,数据也是好的,”首席科学家兼技术研究员Jaime Teevan说。“您必须相信您的数据处于合规范围内。您必须相信响应的可靠性。你必须相信奇怪的事情不会发生。”
也就是说,微软正在为其应用程序的用户做好准备,以应对AI倾向于随意处理事实的倾向。“您必须[批判性地]查看数据、内容以及它为您提供的内容,”负责Microsoft 365 Copilot营销和该公司对未来工作进行研究的Colette Stallbaumer说。“但它会让你更进一步,因为它给了你一个起点,或者也许是六个起点。”
事实是,即使是微软也只能对人们如何使用这些新的Copilot做有限的预测,到目前为止,它只提供给有限的测试人员。研究人工智能对工作影响的沃顿商学院教授伊森·莫里克(Ethan Mollick)表示,微软渴望将GPT-4融入其产品中,“将立即在各地带来巨大的变化”。他预计80%到90%的商业文档最终将涉及机器生成的初稿。
不过,在Microsoft 365 Copilot面市之前,这种转变还不会开始。微软尚未宣布发布日期,但表示Copilot将每用户每月另外收费30美元。这高昂的价格引起了一些震惊,但如果Copilot证明了它的价值,这可能会为该公司40年历史的生产力软件业务带来丰厚的收益。
最终,生成式人工智能可能会带来甚至连微软都无法完全理解的更具变革性的体验。Windows将在今年秋天推出Copilot,它可以执行从自动调整设置到建议提高生产力的情绪音乐等所有操作,但首席产品官Panos Panay已经在思考超越聊天机器人的问题。随着时间的推移,“我认为PC的演变以及Windows的交互模式将会发生巨大的变化,”他说。
Evercore ISI分析师Kirk Materne在6月份预测,到2027年,人工智能将为微软的年收入增加500亿至1000亿美元。这将是该公司与OpenAI合作伙伴关系的巨大回报,尽管这种合作关系也不是一帆风顺。《华尔街日报》6月报道了“幕后的冲突和混乱”,包括ChatGPT和Bing各自的策略争议,以及争相签约同一云计算客户的竞争。
纳德拉显然并没有因为该公司未能自行开发出像GPT-4这样强大的东西而感到困扰。“我对我们在OpenAI之上、之下和周围构建的一切感到非常兴奋,”他说。“所以我不会看着它说,‘天啊,我希望我能创建OpenAI。’”我的想法更像‘如果我们没有与OpenAI合作会怎么样?’我会更后悔那样!”
“让我们找出它出现故障的情况”
在2017年出版的《刷新》一书中,纳德拉写了他的儿子Zain,他于1996年出生时患有严重的脑瘫。他解释说,照顾Zain并试图通过他的眼睛看世界使他成为一个更有同情心的人和一个更好的领导者,永远会注意到微软对全球无数日常生活的方方面面的影响。
2018年,微软确立了负责任人工智能的六大原则:问责性、包容性、可靠性和安全性、公平性、透明度、隐私和安全性。该公司表示,当出现问题时,它不会移开目光。“我对[AI]何时起作用不感兴趣,”首席科学家Teevan说。“我想,‘当它不起作用时告诉我。’萨提亚就是这样的心态:“让我们找出失败的案例,以及我们如何从中学习。”
这种保证也只能到此为止。““很多人都说得很好,”消息应用程序制造商Signal的总裁、前谷歌研究员梅雷迪思·惠特克(Meredith Whittaker)说道。“但归根结底,这些系统的商业模式是确保随着时间的推移推动微软营收的增长。”她认为,大公司控制的人工智能具有侵犯隐私、传播偏见、加剧不平等以及以其他方式损害社会的固有倾向。
与OpenAI等公司一样,微软表示欢迎政府以新法律的形式进行干预,限制公司可以利用该技术做什么。欧盟已经通过了人工智能法案草案,不过接下来还需要数月的审议时间。史密斯表示,美国也可能很快介入:“我认为,甚至在今年年底之前,我们就有可能看到一些非常有针对性的立法。”
但正如史密斯告诉我,最快的进展可能来自人工智能的自愿守则,美国、欧盟、英国、印度和其他国家正在制定这一守则。“如果他们这样做,这将是自二战结束以来他们第一次做如此规模、速度和国际规模的事情,”他说。“人们会感到真正有压力要求他们签署它,......它将为所有后续立法提供蓝图。”7月,包括微软、Meta、谷歌和OpenAI在内的七家公司宣布自愿遵守一系列新的人工智能安全措施。
当我问纳德拉他对人工智能最担心的是什么时,他停顿了一下。然后他说,他担心该行业会在“无聊”的应用上浪费时间,因为这项技术有巨大的潜力为这么多人带来好处。
他有一个最喜欢的关于人工智能积极影响的例子:他最近去印度旅行时看到的一个演示,展示了一名农村农民如何使用WhatsApp向GPT支持的服务询问政府补贴计划,然后用他不懂的语言填写必要的表格。
“在硅谷,每个人都一直在谈论过剩,但没有过剩,”他带着遗憾的笑声补充道。“我最专注于这一点。”
目前,纳德拉是所有人中为人工智能提供机会最有利的,尽管他深知未来的竞争将非常激烈,微软目前的领先地位可能只是暂时的。“就我而言,技术的早期领先地位并不重要,”他说。
目前,在所有能够抓住人工智能机遇的人中,纳德拉处在最有利的位置之上,尽管他敏锐地意识到未来的竞争将非常激烈,而微软目前的领先地位可能会转瞬即逝。“就我而言,技术的早期领先并不重要,”他说。尽管他在担任首席执行官的第一个十年中取得了成功,但他利用未来机会所做的事情可能会定义他留下的印记。
原文地址:https://www.fastcompany.com/90931084/satya-nadella-microsoft-ai-frontrunner
来源:https://view.inews.qq.com/k/20230827A058R600
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作! |
|