一周的工作在一片哀嚎中结束:微软蓝屏啦!
当地时间7月18日、北京时间7月19日开始,微软旗下部分应用和服务出现访问延迟、功能不全或无法访问的问题。
从普普通通的打工人,到航空公司、银行、交易所、学校等,都有可能受到影响。
因为电脑蓝屏提前下班,走在街上看到广告牌蓝了、商场前的大屏幕蓝了,遛弯去超市买菜,发现超市收银系统也蓝了。这时候,朋友发来消息,机场蓝了,航班取消,明天是回不来了。
这场景未免有点过于赛博了。
目前,微软大面积蓝屏的“凶手”已经被揪了出来——美国网络安全服务提供商CrowdStrike,由于一则更新错误。微软也表示根本问题已经得到解决,但是残余影响仍未完全消除。
但人类显然余惊未了:要不是微软突发恶疾,谁会意识到人类到底是有多依赖它呢?
微软作为电脑操作系统大战的胜利者,已经渗透人们生活的方方面面,成为人类社会的一个基础工具。如今全球正在进行一场新的商业大战,人工智能(下称AI)之战。AI将是下一个“基础设施”,几乎成了现阶段的一种共识。
就在微软蓝屏事件发生的数个小时前,OpenAI发布了一个小模型,GPT-4o mini,价格也大幅下降。虽然没有发布会,没有大张旗鼓地宣传,但这个消息还是让整个科技界兴奋不已。够强、够小、够便宜的小模型,意味着应用开发者有福了,换个角度来看,OpenAI此举会让其模型在落地应用层有更大的影响力。
无独有偶,同日Mistral AI联合英伟达也发布了一个小模型Mistral NeMo,硅谷模型之战从大到小,愈发落地。
《福布斯》举了这样一个例子:“基于AI驱动系统安排的紧急心脏或脑部手术。如果由于CrowdStrike或软件供应链中其他公司的补丁更新导致基础技术出现故障,例如机器未正确重启,后果可能是致命的。”
这可能是微软蓝屏事件带来的正面意义之一,迫不及待迈入AI时代的人类需要意识到“依赖”的危险之处。正在不遗余力造就下一代基础设施的OpenAI们,更需要防蓝屏。
微软这次的蓝屏事件造成了多大混乱?
世界首富、著名企业家、知名网红埃隆·马斯克(Elon Musk),他在社交平台X(前推特)上称之为“IT史上最大的失误”。
打工人倒是挺高兴的,正想着怎么结束周五的工作,开启快乐周末,电脑突发恶疾,出现蓝屏还反复重启。那能怎么办呢,提前下班呗,咱也很无奈呢。
哦对了,下班之前别忘了合个影,祝大家国际蓝屏日快乐!
当然,也有很多打工人和学生仔开心不起来,毕竟有的时候真的在关键时刻,蓝屏了并不意味着提早休息,而是提前投胎的心都有了。尤其是在文件没保存的时候……
另一些人的不开心,来自几乎全公司电脑都蓝了,除了自己。谢谢微软,坐实了自己“天选牛马”的身份。
办公室的小小蓝色屏幕不算啥,更具冲击力的是走出办公室之后,发现商场前的大屏、机场大大小小的屏幕、超市收银系统,甚至是街边硕大的电子广告牌,全都“蓝”了,角落里的悲伤颜表情直击人心。
实际上,微软蓝屏事件造成了一连串的“灾难”。
美国、德国、澳洲等多地机场几乎瘫痪,光是美国就有超过2000架次航班停飞(达美航空和美联航停飞所有航班),超过5300架次航班延误。大批旅客滞留,从值机柜台上的小屏幕,到巨大的导引屏幕,机场一片“蓝海”。
伦敦证券交易所在亚洲交易时段,无法发布新闻。澳大利亚广播公司遭遇故障,英国天空新闻台也无法直播。银行也受到了波及,南非、以色列、新西兰等国银行受到影响,英国至少有两家银行的用户无法登录自己的账户。
最让人揪心的是一些紧急热线和医疗机构也受到了影响。美国多地出现911呼叫中心工作不正常的情况;英国大多数全科医生诊所因为病人预约和病历系统出现问题,无法开展工作,以色列卫生部表示十几家医院受到了影响。不过好在全球大多数医院多多少少还是会有人工的、纸质化的工作打底,所以工作还是可以展开,急诊也照常运作。
当然,很多企业也会受到影响。
美国特斯拉工厂也受到波及。由于一些工厂的设备开始报错,特斯拉位于奥斯汀、得克萨斯和内华达的超级工厂的部分工人提前下了班。
这让特斯拉的CEO马斯克大为光火,甚至在X(前推特)上追着微软CEO萨提亚·纳德拉(Satya Nadella)表达不满,称“这对汽车供应链带来了严重的冲击”。
在发现事件的“始作俑者”是网络安全公司CrowdStrike后,马斯克表示已经在所有的系统里删除了CrowdStrike的组件。他随后补充道:“不幸的是,我们的许多供应商和物流公司都在使用它。”
马斯克的高仿号贴心地发了一张AI生成的图,图中马斯克站在熊熊燃烧的CrowdStrike服务器前,表达了事件当事人的愤怒之情。
“7·19微软蓝屏事件”注定会被载入历史,CrowdStrike也从业内知名变得家喻户晓。
造成如此灾难的原因,小到略显荒诞:CrowdStrike向微软发送了一则更新。
更具体来说,CrowdStrike有一个名为Falcon的平台,是公司的旗舰产品。事发前,CrowdStrike发布了Windows系统的传感器配置更新,这是Falcon平台保护机制的一部分。这样的更新并不是心血来潮,而是每天都会来几次。
然而,这次配置更新却触发了一个逻辑错误,导致受影响的系统出现系统崩溃和蓝屏。
在事件发生后不久,CrowdStrike的CEO乔治·库尔茨(George Kurtz)连发几条X信息,表明正在全力修复问题的态度,并且安抚大家少安毋躁,并再三强调事件的原因并非网络攻击。北京时间7月20日早晨九点,库尔茨就公布了此次事件的一则技术声明。期间,他还出镜了媒体采访,向公众解释事件的起因和应对,样子略显憔悴。
然而,真诚的态度难以弥补巨大的失误,截至7月19日美股收盘,CrowdStrike的股价收跌11%。
要知道,CrowdStrike在业内早有名气。该公司成立于2011年,提供在线安全解决方案,专注于提供基于云计算的端点保护平台。包括微软、亚马逊AWS在内的一些最大的云服务公司提供商都是它的客户,其客户也包括主要的全球银行、医疗保健和能源公司。
而CrowdStrike的主要平台Falcon也挺有意思,它利用AI和机器学习技术来检测、预防和响应网络威胁。换言之,这是一家以AI驱动安全解决方案的行业佼佼者。
这次事件,势必会对CrowdSrike的这一路径造成打击,并凸显了AI在网络安全中的局限性和风险的重要问题。虽然AI承诺增强检测能力和加快响应速度,但我们需要更有利的监督和验证过程来减轻意外故障的风险。
我们是否真的可以依赖AI管理我们最敏感的安全需要,还是我们对一个不完美的工具给予了太多信任?
有意思的是,一家由AI作为重要卖点的网络安全公司搞了个大失误,另一边,AI界的明星公司在发新模型。
北京时间7月19日凌晨,也就是微软蓝屏事件发生前的数小时,OpenAI默默上线GPT-4o mini模型。发布的方式非常低调,但消息还是登时传开,因为这是一个对OpenAI来说很不同的模型。
GPT-4o mini,如其名,主打一个“小”,此外能力强劲,且价格美丽。
OpenAI并没有透露其具体的参数规模,但称其为公司目前最经济、最有成本效益的小模型。GPT-4o mini的知识更新到去年10月,从支持的语言种类来看和GPT-4o相当,上下文窗口有128k,MMLU得分82,颇具竞争力。
最关键的是,GPT-4o mini每百万token输入仅需15美分,每百万输出则需60美分。比GPT-4o便宜了96%~97%,比起GPT-3.5 Turbo也要便宜60%~70%。OpenAI CEO山姆·奥特曼(Sam Altman)以2022年“世界上最好的”模型text davinci-003(GPT-3)做比,后者能力被GPT-4o mini甩几条街,价格却比GPT-4o mini高出100倍。
出小模型,跳入价格战,凸显OpenAI扩大应用的决心。
OpenAI的API平台产品负责人甚至表示GPT-4o mini才真正实现了OpenAI的使命,让人们更广泛地接触AI。
他透露OpenAI之所以有此举,是因为他们注意到开发人员越来越渴望使用较小的模型。
小模型已经成了硅谷巨头和明星初创公司的新锚点。同日,Mitral AI联手英伟达也推出了一款小模型Mistral Nemo,参数规模仅12B,性能赶超Meta的Llama-3 8B。Hugging Face的创始人感慨:“这是属于小模型的一周。”
更多小模型在早些时候已经问世,如谷歌的Gemini Flash,Anthropic的Claude Haike等。就连千呼万唤始出来的苹果AI——Apple智能,也没有走“大杯”路线,而是用设备端小模型,将重点放在了针对用户体验的微调。
在OpenAI官网关于GPT-4o mini的博文中,这样写着:“我们展望未来,模型将无缝集成到每个应用程序和每个网站上。GPT-4o mini正在为开发人员更有效、更经济地构建和扩展功能强大的AI应用程序铺平道路。AI的未来正变得更容易获得、更可靠,并且嵌入到我们的日常数字体验中,我们很高兴能够继续引领这条道路。”
“无缝集成到每个应用”“嵌入到日常数字体验中”,这正是微软的操作系统已经做到的。从堆参数不断扩大规模的超大模型,到灵活易用、物美价廉的小模型,先大后小,AI生产商都想要成为下一个“微软”。
但关于AI模型和应用的安全问题,却始终都没有一个确切的保障路径。AI安全天天被讨论,却尚未有定论。而与此同时,AI仍在向前狂奔。
也许微软蓝屏事件,是新老交替之际的一记警钟,如果AI真的如OpenAI们的畅享般“嵌入到日常数字体验中”“无缝集成到每个应用”, “蓝屏”会造成的灾难,留给诸位想象吧。
Prev Chapter:为什么AI公司都要用“星星”符号?
Next Chapter:微软、英伟达、英特尔、谷歌等组建CoSAI安全联盟