AI

当前位置：首页 > 技术圈 > AI

大模型与程序员，谁吃了谁

更新时间：2024-07-03 16:15:37 编辑：管理员浏览：410

大模型与程序员，谁吃了谁

一名失业中的程序员，因为一次大胆的求职之举登上了微博热搜。

向瑶函花费999元，在广州地铁珠江新城站购买了一个广告位5天的使用权，用来投放自己的简历二维码，扫码就可以了解这名程序员“飘零的前半生”。

向瑶函是在2023年5月“主动失业”的。去年3月15日凌晨GPT-4发布，兴奋之余，他和很多其他程序员隐隐感到不安——面对生成式AI技术的爆发，是当一名旁观者，还是主动拥抱新变化？

此时的向瑶函还在广州一家粮食企业当数据经理，热衷于AI比赛的他总是自诩为“AI狂热分子”，业余在广州的互联网行业咨询圈子也干得有声有色。

2023年5月，举办了4场小范围AI讲座后，向瑶函明显感到大模型的热度已经不能简单地用“陡然上升”来形容。

来参加讲座或来咨询的广州老板们陷入了AI焦虑，不论是哪行哪业，企业多大多小，都琢磨起了建大模型的主意。

但向瑶函当时的东家——一家把泰国的大米卖到中国的上市公司，似乎对做AI并不感兴趣。“AI是大方向”“我要做AI”“指不定成为中国AI界一颗冉冉升起的新星”……抱着这样的想法，雄心勃勃的他计划转型去当一名算法工程师。

大模型呼啸而至，互联网已经很久没有经历这样的技术冲击了。互联网时代的技术岗打工人，和前线大模型公司，这两块拼图要完全吻合，难度超乎想象。

消失的产品经理

事情没有向瑶函想得顺利，“门槛确实太高了，很多招聘要求是能开发底层大模型”。

向瑶函自认在写代码这件事上是有天赋的，在AI比赛上靠写中小模型也获过不少奖项，但对大模型经验寥寥。

更糟糕的是，毕业于湘潭大学企业营销专业的他，曾经靠自学Python闯入技术圈，但“英雄不问出处”的法则在大模型行业失灵了，“学历上就卡死了”。

市场达成了自己的共识，这个共识就是追求确定性，以实现不确定性。

要在大模型行业有一席之地，人才密集和资金密集与否，是唯二决定生死的核心要素。

大家多少清楚如今大环境下投资人的谨慎，至于人才，情况要令人困惑得多——从大厂高管、创业公司老板，再到投资人、猎头，没人了解方向，都在从零摸索起。

作为大模型初创公司共生团队负责人，张林最近做了一个决定，暂时搁置招聘产品经理的工作。

创办共生团队几个月后，市场给忙于吸纳人才的张林上了最新一课——大模型公司很难在互联网体系内找到可以经验复用的产品经理。放弃招聘后，他和几位AI工程师出身的创始团队成员，兼起了公司产品经理的职责。

“我们筛选过很多产品经理的简历，做UI的、产品的等等，但他们的共同问题是，不了解大模型项目的底层机制，导致没有办法很快迁移经验。”张林说道，“如果理解程度是‘画一个界面’，那最后基本一塌糊涂。”

国产大模型已经卷了一年半，但张林至今没有看到“比较高质量”的产品经理出现。他产生了巨大的紧迫感。

他告诉36氪，创办公司几个月的时间里，团队更加坚定了这样的认知：“我们尝试从原子化角度来看，如果一个新技术让单个个体角色发生根本性变化，那么由这样一个个体所组成的单位和系统，自然也逃不过变化。”

大模型猎头Louis则感觉“所有人都在追逐同一拨人”，就是清华帮那十几个，“如果追求对底层大模型的认知，国内只有他们。”

“无论创业公司还是大厂都在问我同样的事情：唐杰老师（智谱AI首席科学家、清华大学计算机系教授）的减一（直属下级）能不能挖来？岂凡超（深言科技创始人、清华大学人工智能研究院教授孙茂松的学生）的减一能不能挖来？”

短时间内，清华帮十余人成了国内大模型人才市场唯一的确定性，要招他们之外的人，大家几乎连招聘要求怎么写都没有头绪。

资深猎头肖恩曾接过几个互联网大厂的大模型招聘需求，只不过对接的过程令他有些哑然失笑。

“某头部大厂根本不知道想要什么，还异想天开想从OpenAI、Meta什么的挖人。”“有些大厂大模型团队办公室都开到国外了，但是也没做出什么水花，也不知道未来要干什么。”

投资人也在雾里看花。曾经有投资人问张林，是不是国内（大模型公司）已经泛滥了，这让张林感到无奈。“根本不可能，真正能做底层大模型的始终只有那一拨人，无非是几个团队间绕来绕去，这个技术很难短期内扩散。”

眼下，优秀的AI工程师就像上世纪九十年代的程序员，匮乏且抢手。技术招聘平台CoderPad近期发布的报告显示，“AI专家”成为最难填补的职位第二名，而即使在十年前的上一轮AI革命，AI专家的招聘难度都未曾进过前三。

去年Louis为一家大模型团队招聘一系列技术岗位，包括数据清洗和SFT（有监督微调）等。和所有人一样，她最开始的路线是专找圈内“掐尖儿”的技术人员，但很快这些候选人被验证“又贵又不好用”。

很大一个原因在于，大模型时代，技术岗位边界在变得模糊。

张林的技术团队不到10个人，除去一两位专做底层大模型的工程师，其他人绝大部分精力用来做系统设计和产品设计，写代码的比重越来越小。“落地时，谁写的代码谁就自己做项目经理。”

HiDream.ai的研发人员同样覆盖全流程，公司创始人兼 CEO梅涛博士告诉36氪：“工程师做完模型自己封装，才跟得上迭代的速度。”

36氪走访了解到，行业普遍的预测是，未来程序员和产品经理两个岗位将合体。

要找到符合这样要求的复合型人才是件难事。一方面，如张林的经历，现阶段市场里没有现成的人选，另一方面，需要跟时间赛跑的大模型公司们，也不被允许等待市场培养出成熟人才后再收割，大模型迭代，晚一天都是万亿参数训练的落后。

经过一年摸索后，Louis感觉国产大模型人才需求进入阶段性稳定期，呈现出一种“哑铃状”格局，要么追求头部技术大咖，要么招应届或在读的学生。

“有些公司的心态是，大模型极大地降低了编程门槛，那对于一些非核心技术岗，利用开源大模型也可以迅速学会，应届生又便宜、技术又新，Why not？”Louis说道。

张林在碰壁后也发现，通过招聘的方式，已经很难找到技术和产品的多面手，他选择另辟蹊径，从源头培养。

他告诉36氪，共生团队已经开始广泛跟高校合作，“我自己在带硕士和博士的科研项目，在这个过程中发掘足够强的候选人，将来自然而然进入公司工作。”

张林的做法并不少见，学术和工程边界加速弥合，是大模型公司带来的新变化。以Midjourney为例，11人团队中，9人是研发人员，没有产品经理，且9位研发人员中，有4位都是尚未毕业的本科生。

而“工业界与学术界融合”最为成熟的标杆，自然是OpenAI。

过往，新的技术突破总是最先诞生在学术界，但ChatGPT成为一个节点——一个独立于大公司之外的研究型组织，引入一批“年轻甚至在读的顶尖学者”，将科学和产品、商业结合，才最终诞生了ChatGPT这样伟大的系统。

“过去把研究型组织安插在大公司，这样的AI Lab模式已经成为历史了。”月之暗面创始人杨植麟日前在接受腾讯新闻采访时表示，AGI的生产方式跟互联网不一样，科研或教育系统会转变职能，变成培养人才为主。

这一轮技术革命中，经验的重要性被不断降级，取而代之的是“拥有足够新的知识”，越来越多科技领域学者，在学术生涯早期便介入工业界。

在此背景下，大模型老板们自然也是下手多早都不为过。“本科生我们都不放过”，据张林观察，在大模型时代，本科生甚至比博士生更容易出东西，“没有（旧技术的）负担很重要”。

并非取代那么简单

大模型或许是属于技术追求者的最好的时代，它更单纯、更聚焦、更长期主义。产品是否受欢迎，比拼的几乎只有技术。

这也造成了一种技术焦虑——新一轮技术冲击下，跟不上就会被抛弃吗？

地铁站求职广告发布后，有50多家企业找到向瑶函，这本该令人高兴，但30多次面试下来，靠谱的工作还是偏数据分析。他不得不告诉自己，自己的“大模型梦”可能很难实现了。

“感觉大模型出来后，之前学了三年python都白费了。”

在他身边，案例也逐渐变得两极化，有人因为在高精尖行业做大模型如鱼得水，也有以“AI可以取代你”为名而被迫离职的案例。

向瑶函眼下的职业困境，或许和大模型编程能力的完善有关，这听上去简直是个悖论。

编程是从计算机诞生起就存在的概念，是构建互联网最基础和底层的工作。与此同时，编程语言一直在进化，从最初的二进制，到后来的机器代码、汇编语言，再到高级语言，诸如C语言、JAVA、Python等当下流行的编程语言都已有三四十年的历史。

2021年时，OpenAI就开发出了Codex系统，Codex可根据程序员的自然语言输入进行简单的代码编写支持，被看作是AI编程的开端，这之后便开始有声音讨论“大模型取代程序员的可能性”。

直到最近，类似产品开始井喷，一批“码农大模型“密集诞生。比如初创公司Cognition发布的首个AI软件工程师Devin、蚂蚁集团CodeFuse平台推出的“图生代码”技术、微软根据OpenAI的Codex模型开发的代码建议工具GitHub Copilot……

今年年初，技术招聘平台CoderPad的一份调查显示，超过80%的开发者正在工作中使用ChatGPT或Copilot。CSDN的一份调查则显示，35%的开发者每天使用代码生成工具，其中36%的人认为开发效率得到极大提升。

相比于过去一段日子大模型学会画画、做视频和作曲，“学会编程”这件事之所以更具有颠覆意味，在于互联网的生产方式围绕编程展开。编程之外，还有需求分析、测试运维、数据洞察等成体系的开发流程，改变了基础编程，就改变了互联网的生产方式。

用英伟达CEO黄仁勋的话说，“现在世界上每个人都是程序员”——过去需要编程语言完成的工作，如今使用自然语言就可以完成。

“从早期的COBOL语言到现在的Java、Rust、JavaScript，编程语言之父们发明了数百种编程语言，只为让开发更容易。”CSDN创始人兼董事长蒋涛说，如今大模型允许自然语言生成代码后，“我们预计在未来3年至5年，全球开发者会从现在的1亿增长至10亿规模。”

当个体开发者增长到一定规模后，蒋涛预测会出现一批超级程序员个体，会像视频的up主一样，提供类似freelancer的软件开发服务。

当然，硬币永远有另一面。

“把编程能力看作是一个金字塔形状的话，大模型吃掉的是最下面一两层、门槛最低的写代码能力，比如代码辅助和生成，市场对开发者的需求会向上层能力转移。”蒋涛说道，“这一调整过程中，一定会经历一个阶段，是程序员失业期。”

Motherboard和Blind此前展开了一项有9388名工程师参与的调查，数据显示有66%的人认为找工作变得更加困难了，而从岗位供给来看，Motherboard表示人工智能将导致程序员招聘人数减少。

作为前沿试验场，硅谷大模型公司的人才结构说明了一切。Midjourney只有11名全职员工，Magnific AI只有2名全职员工，Sora只有13人。

36氪受访者中，共生团队同样只有十余人，HiDream.ai则只有不到30人。

与此对应的变化是，虽然大模型公司的全职开发团队在精简甚至缩编，但“零工”体量在变大。

CoderPad数据显示，去年近六成招聘方为了满足技术需求，会招聘临时工或实习生技术岗。Midjourney同样是个典型的例子，在11人全职团队外，其外包人员达60余人。

拉长时间看，这样的变化和“取代”发生在一次又一次的技术迭代之中。

25年前，蒋涛创办CSDN的上世纪90年代，他们这群“国内第一批互联网程序员”还曾需要自己“画窗口”。

蒋涛告诉36氪：“程序员的工作，几乎每天都在经历自动化。过去几次自动化，是给程序员提供了‘框架’，如何使用框架，还需要程序员的能力，但如今这一能力被大模型掌握了。”

90后软件工程师苏奇试用了几次大模型后，并未引发他过多的职业焦虑。“可以取代一部分重复工作来提升效率，比如idl和一些POJO代码，但本身壁垒不深的技术岗，比如测试、SRE、前端，可能会最早受到冲击。”

他的焦虑不来自于取代本身，而是来自于如何确定自己是否会被取代。

“假设大模型取代了简单工种，原来的程序员只保留了头部的30%到50%，但我如何判断自己是否是前30%？”苏奇说，“比如一个应届生刚工作，没有经验，基本无法判断自己的身位。”

开发者更好的时代？

技术开发所需要的核心人员越来越少，过去互联网时代堆人头的开发方式，在大模型时代不再奏效。

大模型是互联网之外的一个新底座，互联网旧系统很可能已经不再适用，大模型之上的生产方式与组织方式要被重构。

比如“螺丝钉”，这一诞生在互联网时代的名词，张林觉得会在技术行业消失。

“即使未来共生团队扩张，业务增加，我们技术团队的人数也不会暴增。不管哪个做大模型的公司或机构，如果哪天突然人数暴增，我觉得都是不正常的。”

蒋涛抱有类似的看法。虽然互联网三十年，庞大的软件程序是靠每一位程序员的每一行代码建立，但从另一个角度看，“‘程序员’同样是过去软件开发最大的阻碍”。

“一个没有编程知识的人，即使有想法，也无法落地成应用。所以即使几十年过去，程序员数量仍然远远小于需求量。”蒋涛说道，“而对于公司而言，如果想开发任何软件，算一下调用和雇佣程序员的ROI，大部分应用可能就被放弃了。”

杨植麟此前在腾讯新闻采访中被问及，如果Sam Altman是在微软内部领导微软旗下的人工智能团队，会和OpenAI有什么不同。他直言，要在旧文化里产生新组织，难度很大。

苏奇曾先后在中美的三家互联网大厂做软件工程师，在应聘过程中，他发现国内各个阶段的互联网公司招聘，都很喜欢要“速赢人才”。

“一家公司要做A业务，就要把竞对大厂做A业务很多年的人直接挖过来，能带点PPT和代码就更好了。这导致什么？整个行业的技术框架高度同质化。比如搜推都是百度的架子，订单、支付、对账都是阿里的。”

“速赢人才”能最大程度促进扩张，这自然对追求规模效应的互联网公司至关重要。当然，算法好坏也很关键，但仍然比不上在当地铺了多少地推、发了多少补贴、办了多少拉新活动重要。

不管是“速赢人才”还是“螺丝钉”，互联网公司的生产逻辑，是尽可能细得切割个人能力，然后将个体固定在某一环节进行生产。但36氪的多个受访者看来，大模型将不再奉行这一逻辑。

梅涛的体会是，哪怕是跟上一代AI四小龙时期比，大模型为代表的AI技术也更为技术导向。“以前一个人脸识别单子下来，十几个供应商都在那里投标，这里面看的不是模型，而是公司的综合解决方案能力。”

他举例，小区闸门的人脸识别、工厂的人脸识别和关口的人脸识别本质都不一样，性能差别很大，无法基于同一个模型底座，最终就变成传统企业的服务现象——需要大量的BD和交付，有N个项目就需要招N倍的人。

“今天的AI，它在任何时候都不是一个商业模式，也不是一个行业，它是一个自己能闭环的技术。”梅涛说。

张林同样遇到过类似的问题。经常有投资人一见面就问他“你们是做哪个行业的”，但这是属于互联网时代的“问法”，“什么是行业”在大模型公司要重新定义。

他一遍遍解释，“和上一代技术不一样，今天很难定义什么叫行业。比如不管是服装设计还是建筑设计，对于大模型来说，它们二者是一样的，因为计算方式一样。大模型有很强的牵引性。”

张林最近跟朋友聊起《人月神话》——这本书被视作软件开发行业的圣经，经历了一段时间大模型创业后，他对这本书的理解更深了。

书中写道，当软件组织体量很大，开发的难度并不是线性增长的关系，而是指数级增长，最后导致重要的开发问题变得异常复杂，像一个“焦油坑”，让所有开发人员深陷其中。

“为什么会这样？很重要的一个原因是，过去的软件开发绝大部分是体力劳动，就是敲代码，当公司越来越大，代码和人员越来越多时，一个组织中需要有1/4甚至更多的人去做管理，这个系统才能运转起来。”张林说道。

《人月神话》更具体地描述了这种困境：比如一个项目需要4个开发，可能需要配2个测试，1个项目管理，2个产品经理等，最终下来，团队中的研发比例只剩不到30%。这本书最终推论，一窝蜂的作业方式无助于软件生产，且会制造麻烦，产生出更差的软件。

在这样臃肿的“旧文化”里，技术创新的空间便愈发逼仄。

苏奇对《人月神话》序章那句“success without applause，diligence without reward.”深有同感，“代码写得好不好、有没有实际价值、是否产生新效益，全凭开发人员主动的自我要求。”

但现实是大部分开发人员都是被动支持系统的“螺丝钉”。苏奇回忆供职的上一家大厂，时常发生的情况是，开发方案A改B晋升了一波人，走之后，方案B改A又晋升了一波人。

“有时为了争取资源，技术人员不得不做点简单问题复杂化但能汇报的东西。”苏奇说，“很多人自己做的产品自己都不用。”

《人月神话》已经是22年前出版的作品，如今软件工程发展了几十年，我们拥有了更快的硬件、更完善的框架、更方便的语言，然而这本书中描述的几十年前的问题，至今都没有被解决，依旧困扰着每一个程序员——

他们依旧无法评估工作量，难以进行合理的进度安排；他们很少能自己控制工作环境和工作目标，而是他人来提供目标和资源；项目落后时，只能被动延长工作时间或者增加人力……

所以软件工程几十年来没有进步吗？原因的源头自然不是技术，而正是几十年未变的生产链条。

GPT4.0 发布一年了，求职者向瑶函仍旧百分百对AI保持热忱，“人”才是他不相信的环节。

那个因为AI被裁员的朋友，没过几个月就发现是新人填补了他的空缺而不是大模型。“AI没有取代这个岗位”，向瑶函甚至怀疑，这仅仅是一个冠冕堂皇的理由。

大模型

收藏打印

上一篇：Meta发布3D Gen AI模型：1分钟内生成高质量3D内容

下一篇：孙正义AI版图再扩张软银股价创三年新高

AI

大模型与程序员，谁吃了谁

相关内容

点击排行

文章归档

评论排行榜

热门标签