大模型与程序员,谁吃了谁_tiknovel-最新最全的nft,web3,AI技术资讯技术社区

大模型与程序员,谁吃了谁

2024-07-03 16:15:06  浏览:383  作者:管理员
大模型与程序员,谁吃了谁

一名失业中的程序员,因为一次大胆的求职之举登上了微博热搜。

向瑶函花费999元,在广州地铁珠江新城站购买了一个广告位5天的使用权,用来投放自己的简历二维码,扫码就可以了解这名程序员“飘零的前半生”。

向瑶函是在2023年5月“主动失业”的。去年3月15日凌晨GPT-4发布,兴奋之余,他和很多其他程序员隐隐感到不安——面对生成式AI技术的爆发,是当一名旁观者,还是主动拥抱新变化?

此时的向瑶函还在广州一家粮食企业当数据经理,热衷于AI比赛的他总是自诩为“AI狂热分子”,业余在广州的互联网行业咨询圈子也干得有声有色。

2023年5月,举办了4场小范围AI讲座后,向瑶函明显感到大模型的热度已经不能简单地用“陡然上升”来形容。

来参加讲座或来咨询的广州老板们陷入了AI焦虑,不论是哪行哪业,企业多大多小,都琢磨起了建大模型的主意。

但向瑶函当时的东家——一家把泰国的大米卖到中国的上市公司,似乎对做AI并不感兴趣。“AI是大方向”“我要做AI”“指不定成为中国AI界一颗冉冉升起的新星”……抱着这样的想法,雄心勃勃的他计划转型去当一名算法工程师。

大模型呼啸而至,互联网已经很久没有经历这样的技术冲击了。互联网时代的技术岗打工人,和前线大模型公司,这两块拼图要完全吻合,难度超乎想象。

01

消失的产品经理

事情没有向瑶函想得顺利,“门槛确实太高了,很多招聘要求是能开发底层大模型”。

向瑶函自认在写代码这件事上是有天赋的,在AI比赛上靠写中小模型也获过不少奖项,但对大模型经验寥寥。

更糟糕的是,毕业于湘潭大学企业营销专业的他,曾经靠自学Python闯入技术圈,但“英雄不问出处”的法则在大模型行业失灵了,“学历上就卡死了”。

市场达成了自己的共识,这个共识就是追求确定性,以实现不确定性。

要在大模型行业有一席之地,人才密集和资金密集与否,是唯二决定生死的核心要素。

大家多少清楚如今大环境下投资人的谨慎,至于人才,情况要令人困惑得多——从大厂高管、创业公司老板,再到投资人、猎头,没人了解方向,都在从零摸索起。

作为大模型初创公司共生团队负责人,张林最近做了一个决定,暂时搁置招聘产品经理的工作。

创办共生团队几个月后,市场给忙于吸纳人才的张林上了最新一课——大模型公司很难在互联网体系内找到可以经验复用的产品经理。放弃招聘后,他和几位AI工程师出身的创始团队成员,兼起了公司产品经理的职责。

“我们筛选过很多产品经理的简历,做UI的、产品的等等,但他们的共同问题是,不了解大模型项目的底层机制,导致没有办法很快迁移经验。”张林说道,“如果理解程度是‘画一个界面’,那最后基本一塌糊涂。”

国产大模型已经卷了一年半,但张林至今没有看到“比较高质量”的产品经理出现。他产生了巨大的紧迫感。

他告诉36氪,创办公司几个月的时间里,团队更加坚定了这样的认知:“我们尝试从原子化角度来看,如果一个新技术让单个个体角色发生根本性变化,那么由这样一个个体所组成的单位和系统,自然也逃不过变化。”

大模型猎头Louis则感觉“所有人都在追逐同一拨人”,就是清华帮那十几个,“如果追求对底层大模型的认知,国内只有他们。”

“无论创业公司还是大厂都在问我同样的事情:唐杰老师(智谱AI首席科学家、清华大学计算机系教授)的减一(直属下级)能不能挖来?岂凡超(深言科技创始人、清华大学人工智能研究院教授孙茂松的学生)的减一能不能挖来?”

短时间内,清华帮十余人成了国内大模型人才市场唯一的确定性,要招他们之外的人,大家几乎连招聘要求怎么写都没有头绪。

资深猎头肖恩曾接过几个互联网大厂的大模型招聘需求,只不过对接的过程令他有些哑然失笑。

某头部大厂根本不知道想要什么,还异想天开想从OpenAI、Meta什么的挖人。”“有些大厂大模型团队办公室都开到国外了,但是也没做出什么水花,也不知道未来要干什么。”

投资人也在雾里看花。曾经有投资人问张林,是不是国内(大模型公司)已经泛滥了,这让张林感到无奈。“根本不可能,真正能做底层大模型的始终只有那一拨人,无非是几个团队间绕来绕去,这个技术很难短期内扩散。”

眼下,优秀的AI工程师就像上世纪九十年代的程序员,匮乏且抢手。技术招聘平台CoderPad近期发布的报告显示,“AI专家”成为最难填补的职位第二名,而即使在十年前的上一轮AI革命,AI专家的招聘难度都未曾进过前三。

去年Louis为一家大模型团队招聘一系列技术岗位,包括数据清洗和SFT(有监督微调)等。和所有人一样,她最开始的路线是专找圈内“掐尖儿”的技术人员,但很快这些候选人被验证“又贵又不好用”。

很大一个原因在于,大模型时代,技术岗位边界在变得模糊。

张林的技术团队不到10个人,除去一两位专做底层大模型的工程师,其他人绝大部分精力用来做系统设计和产品设计,写代码的比重越来越小。“落地时,谁写的代码谁就自己做项目经理。”

HiDream.ai的研发人员同样覆盖全流程,公司创始人兼 CEO梅涛博士告诉36氪:“工程师做完模型自己封装,才跟得上迭代的速度。”

36氪走访了解到,行业普遍的预测是,未来程序员和产品经理两个岗位将合体。

要找到符合这样要求的复合型人才是件难事。一方面,如张林的经历,现阶段市场里没有现成的人选,另一方面,需要跟时间赛跑的大模型公司们,也不被允许等待市场培养出成熟人才后再收割,大模型迭代,晚一天都是万亿参数训练的落后。

经过一年摸索后,Louis感觉国产大模型人才需求进入阶段性稳定期,呈现出一种“哑铃状”格局,要么追求头部技术大咖,要么招应届或在读的学生。

“有些公司的心态是,大模型极大地降低了编程门槛,那对于一些非核心技术岗,利用开源大模型也可以迅速学会,应届生又便宜、技术又新,Why not?”Louis说道。

张林在碰壁后也发现,通过招聘的方式,已经很难找到技术和产品的多面手,他选择另辟蹊径,从源头培养。

他告诉36氪,共生团队已经开始广泛跟高校合作,“我自己在带硕士和博士的科研项目,在这个过程中发掘足够强的候选人,将来自然而然进入公司工作。”

张林的做法并不少见,学术和工程边界加速弥合,是大模型公司带来的新变化。以Midjourney为例,11人团队中,9人是研发人员,没有产品经理,且9位研发人员中,有4位都是尚未毕业的本科生。

而“工业界与学术界融合”最为成熟的标杆,自然是OpenAI。

过往,新的技术突破总是最先诞生在学术界,但ChatGPT成为一个节点——一个独立于大公司之外的研究型组织,引入一批“年轻甚至在读的顶尖学者”,将科学和产品、商业结合,才最终诞生了ChatGPT这样伟大的系统。

“过去把研究型组织安插在大公司,这样的AI Lab模式已经成为历史了。”月之暗面创始人杨植麟日前在接受腾讯新闻采访时表示,AGI的生产方式跟互联网不一样,科研或教育系统会转变职能,变成培养人才为主。

这一轮技术革命中,经验的重要性被不断降级,取而代之的是“拥有足够新的知识”,越来越多科技领域学者,在学术生涯早期便介入工业界。

在此背景下,大模型老板们自然也是下手多早都不为过。“本科生我们都不放过”,据张林观察,在大模型时代,本科生甚至比博士生更容易出东西,“没有(旧技术的)负担很重要”。

02

并非取代那么简单

大模型或许是属于技术追求者的最好的时代,它更单纯、更聚焦、更长期主义。产品是否受欢迎,比拼的几乎只有技术。

这也造成了一种技术焦虑——新一轮技术冲击下,跟不上就会被抛弃吗?

地铁站求职广告发布后,有50多家企业找到向瑶函,这本该令人高兴,但30多次面试下来,靠谱的工作还是偏数据分析。他不得不告诉自己,自己的“大模型梦”可能很难实现了。

“感觉大模型出来后,之前学了三年python都白费了。”

在他身边,案例也逐渐变得两极化,有人因为在高精尖行业做大模型如鱼得水,也有以“AI可以取代你”为名而被迫离职的案例。

向瑶函眼下的职业困境,或许和大模型编程能力的完善有关,这听上去简直是个悖论。

编程是从计算机诞生起就存在的概念,是构建互联网最基础和底层的工作。与此同时,编程语言一直在进化,从最初的二进制,到后来的机器代码、汇编语言,再到高级语言,诸如C语言、JAVA、Python等当下流行的编程语言都已有三四十年的历史。

2021年时,OpenAI就开发出了Codex系统,Codex可根据程序员的自然语言输入进行简单的代码编写支持,被看作是AI编程的开端,这之后便开始有声音讨论“大模型取代程序员的可能性”。

直到最近,类似产品开始井喷,一批“码农大模型“密集诞生。比如初创公司Cognition发布的首个AI软件工程师Devin、蚂蚁集团CodeFuse平台推出的“图生代码”技术、微软根据OpenAI的Codex模型开发的代码建议工具GitHub Copilot……

今年年初,技术招聘平台CoderPad的一份调查显示,超过80%的开发者正在工作中使用ChatGPT或Copilot。CSDN的一份调查则显示,35%的开发者每天使用代码生成工具,其中36%的人认为开发效率得到极大提升。

相比于过去一段日子大模型学会画画、做视频和作曲,“学会编程”这件事之所以更具有颠覆意味,在于互联网的生产方式围绕编程展开。编程之外,还有需求分析、测试运维、数据洞察等成体系的开发流程,改变了基础编程,就改变了互联网的生产方式。

用英伟达CEO黄仁勋的话说,“现在世界上每个人都是程序员”——过去需要编程语言完成的工作,如今使用自然语言就可以完成。

“从早期的COBOL语言到现在的Java、Rust、JavaScript,编程语言之父们发明了数百种编程语言,只为让开发更容易。”CSDN创始人兼董事长蒋涛说,如今大模型允许自然语言生成代码后,“我们预计在未来3年至5年,全球开发者会从现在的1亿增长至10亿规模。”

当个体开发者增长到一定规模后,蒋涛预测会出现一批超级程序员个体,会像视频的up主一样,提供类似freelancer的软件开发服务。

当然,硬币永远有另一面。

“把编程能力看作是一个金字塔形状的话,大模型吃掉的是最下面一两层、门槛最低的写代码能力,比如代码辅助和生成,市场对开发者的需求会向上层能力转移。”蒋涛说道,“这一调整过程中,一定会经历一个阶段,是程序员失业期。

Motherboard和Blind此前展开了一项有9388名工程师参与的调查,数据显示有66%的人认为找工作变得更加困难了,而从岗位供给来看,Motherboard表示人工智能将导致程序员招聘人数减少。

作为前沿试验场,硅谷大模型公司的人才结构说明了一切。Midjourney只有11名全职员工,Magnific AI只有2名全职员工,Sora只有13人。

36氪受访者中,共生团队同样只有十余人,HiDream.ai则只有不到30人。

与此对应的变化是,虽然大模型公司的全职开发团队在精简甚至缩编,但“零工”体量在变大。

CoderPad数据显示,去年近六成招聘方为了满足技术需求,会招聘临时工或实习生技术岗。Midjourney同样是个典型的例子,在11人全职团队外,其外包人员达60余人。

拉长时间看,这样的变化和“取代”发生在一次又一次的技术迭代之中。

25年前,蒋涛创办CSDN的上世纪90年代,他们这群“国内第一批互联网程序员”还曾需要自己“画窗口”。

蒋涛告诉36氪:“程序员的工作,几乎每天都在经历自动化。过去几次自动化,是给程序员提供了‘框架’,如何使用框架,还需要程序员的能力,但如今这一能力被大模型掌握了。”

90后软件工程师苏奇试用了几次大模型后,并未引发他过多的职业焦虑。“可以取代一部分重复工作来提升效率,比如idl和一些POJO代码,但本身壁垒不深的技术岗,比如测试、SRE、前端,可能会最早受到冲击。”

他的焦虑不来自于取代本身,而是来自于如何确定自己是否会被取代。

“假设大模型取代了简单工种,原来的程序员只保留了头部的30%到50%,但我如何判断自己是否是前30%?”苏奇说,“比如一个应届生刚工作,没有经验,基本无法判断自己的身位。”

03

开发者更好的时代?

技术开发所需要的核心人员越来越少,过去互联网时代堆人头的开发方式,在大模型时代不再奏效。

大模型是互联网之外的一个新底座,互联网旧系统很可能已经不再适用,大模型之上的生产方式与组织方式要被重构。

比如“螺丝钉”,这一诞生在互联网时代的名词,张林觉得会在技术行业消失。

“即使未来共生团队扩张,业务增加,我们技术团队的人数也不会暴增。不管哪个做大模型的公司或机构,如果哪天突然人数暴增,我觉得都是不正常的。

蒋涛抱有类似的看法。虽然互联网三十年,庞大的软件程序是靠每一位程序员的每一行代码建立,但从另一个角度看,“‘程序员’同样是过去软件开发最大的阻碍”。

“一个没有编程知识的人,即使有想法,也无法落地成应用。所以即使几十年过去,程序员数量仍然远远小于需求量。”蒋涛说道,“而对于公司而言,如果想开发任何软件,算一下调用和雇佣程序员的ROI,大部分应用可能就被放弃了。

杨植麟此前在腾讯新闻采访中被问及,如果Sam Altman是在微软内部领导微软旗下的人工智能团队,会和OpenAI有什么不同。他直言,要在旧文化里产生新组织,难度很大。

苏奇曾先后在中美的三家互联网大厂做软件工程师,在应聘过程中,他发现国内各个阶段的互联网公司招聘,都很喜欢要“速赢人才”。

“一家公司要做A业务,就要把竞对大厂做A业务很多年的人直接挖过来,能带点PPT和代码就更好了。这导致什么?整个行业的技术框架高度同质化。比如搜推都是百度的架子,订单、支付、对账都是阿里的。”

“速赢人才”能最大程度促进扩张,这自然对追求规模效应的互联网公司至关重要。当然,算法好坏也很关键,但仍然比不上在当地铺了多少地推、发了多少补贴、办了多少拉新活动重要。

不管是“速赢人才”还是“螺丝钉”,互联网公司的生产逻辑,是尽可能细得切割个人能力,然后将个体固定在某一环节进行生产。但36氪的多个受访者看来,大模型将不再奉行这一逻辑。

梅涛的体会是,哪怕是跟上一代AI四小龙时期比,大模型为代表的AI技术也更为技术导向。“以前一个人脸识别单子下来,十几个供应商都在那里投标,这里面看的不是模型,而是公司的综合解决方案能力。”

他举例,小区闸门的人脸识别、工厂的人脸识别和关口的人脸识别本质都不一样,性能差别很大,无法基于同一个模型底座,最终就变成传统企业的服务现象——需要大量的BD和交付,有N个项目就需要招N倍的人。

“今天的AI,它在任何时候都不是一个商业模式,也不是一个行业,它是一个自己能闭环的技术。”梅涛说。

张林同样遇到过类似的问题。经常有投资人一见面就问他“你们是做哪个行业的”,但这是属于互联网时代的“问法”,“什么是行业”在大模型公司要重新定义。

他一遍遍解释,“和上一代技术不一样,今天很难定义什么叫行业。比如不管是服装设计还是建筑设计,对于大模型来说,它们二者是一样的,因为计算方式一样。大模型有很强的牵引性。”

张林最近跟朋友聊起《人月神话》——这本书被视作软件开发行业的圣经,经历了一段时间大模型创业后,他对这本书的理解更深了。

书中写道,当软件组织体量很大,开发的难度并不是线性增长的关系,而是指数级增长,最后导致重要的开发问题变得异常复杂,像一个“焦油坑”,让所有开发人员深陷其中。

“为什么会这样?很重要的一个原因是,过去的软件开发绝大部分是体力劳动,就是敲代码,当公司越来越大,代码和人员越来越多时,一个组织中需要有1/4甚至更多的人去做管理,这个系统才能运转起来。”张林说道。

《人月神话》更具体地描述了这种困境:比如一个项目需要4个开发,可能需要配2个测试,1个项目管理,2个产品经理等,最终下来,团队中的研发比例只剩不到30%。这本书最终推论,一窝蜂的作业方式无助于软件生产,且会制造麻烦,产生出更差的软件。

在这样臃肿的“旧文化”里,技术创新的空间便愈发逼仄。

苏奇对《人月神话》序章那句“success without applause,diligence without reward.”深有同感,“代码写得好不好、有没有实际价值、是否产生新效益,全凭开发人员主动的自我要求。”

但现实是大部分开发人员都是被动支持系统的“螺丝钉”。苏奇回忆供职的上一家大厂,时常发生的情况是,开发方案A改B晋升了一波人,走之后,方案B改A又晋升了一波人。

“有时为了争取资源,技术人员不得不做点简单问题复杂化但能汇报的东西。”苏奇说,“很多人自己做的产品自己都不用。”

《人月神话》已经是22年前出版的作品,如今软件工程发展了几十年,我们拥有了更快的硬件、更完善的框架、更方便的语言,然而这本书中描述的几十年前的问题,至今都没有被解决,依旧困扰着每一个程序员——

他们依旧无法评估工作量,难以进行合理的进度安排;他们很少能自己控制工作环境和工作目标,而是他人来提供目标和资源;项目落后时,只能被动延长工作时间或者增加人力……

所以软件工程几十年来没有进步吗?原因的源头自然不是技术,而正是几十年未变的生产链条。

GPT4.0 发布一年了,求职者向瑶函仍旧百分百对AI保持热忱,“人”才是他不相信的环节。

那个因为AI被裁员的朋友,没过几个月就发现是新人填补了他的空缺而不是大模型。“AI没有取代这个岗位”,向瑶函甚至怀疑,这仅仅是一个冠冕堂皇的理由。


评论区

共 0 条评论
  • 这篇文章还没有收到评论,赶紧来抢沙发吧~

【随机内容】

返回顶部