今年以来,文生图模型领域就没消停过。
3月23日,Stability AI CEO Emad Mostaque宣布离职,这个昔日文生图巨头CEO的高调退场给了AI界一次小小的震撼。这并不奇怪。混乱,几乎是Stability AI在过去一年多时间里的缩影:管理层离职、技术团队跑路、入不敷出、法律官司……
一年以前,Stability AI还曾是一家文生图领域的超级明星:当Stable Diffusion推出并宣布彻底开源后,这款AI图像生成模型在上线三个月内用户总量达到1000万。同一时期,DALL-E只有150万用户,Midjourney在200万到300万之间。
变化不仅发生在Stability AI,也发生在Midjourney上。今年1月,Lenardo.ai以18.71M的月访问量首次超越持续霸榜的Midjourney,到了2月,两者差距还在进一步拉大。这意味着,作为文生图领域老大的Midjourney正在面临激烈的竞争。
Stability AI、Midjourney的变化似乎也说明一家事情:与ChatGPT稳定领跑通用型聊天产品不同,垂直AI应用的“王位易主”显然更加容易。
/ 01 /
开源与赚钱无法兼得,Stability AI跌落神坛
AI独角兽Stability AI的坠落并非一夕之变。早在2023年,该公司就有一批管理层和核心技术成员离开团队。
2023年6月,Stability AI首席信息官Daniel Jeffries、工程副总裁Scott Draves和首席运营官Ren Ito都选择了离职。7月中旬,参与了Stability AI大语言模型开发工作的Louis Castricato宣布离职加入EleutherAI。
就在Emad Mostaque离任的前一周,Midjourney就因数据盗窃把Stability AI的员工都拉入了黑名单。《福布斯》报道,亚马逊网络服务(AWS)因StabilityAI迟迟不支付账单,可能会中断服务。也有消息称,Stability AI已经难以支付员工的工资了。
为什么Stability AI会陷入这样的困境?不赚钱,是一个很现实的原因。
Stability AI年收入
现在Stability AI的收入主要分为两大板块,一个是to B的AI模型定制化服务和AI技术咨询,一个是to C的Stable Diffusion产品的会员制付费订阅。
从数据看,Stability AI的收入一直呈增长趋势,由2021年的210万美元到2022年420万美元,2023年甚至达到了4420万。
但这样的收入并不足以支撑Stability AI庞大的研发投入。据彭博社报道,截止2023年10月,StabilityAI每月支出在800万美元,也就是说,Stability AI2023年全年的支出在9600万美元左右,将近全年收入4420万的两倍。
即使对比同行,Stability AI的商业化业绩也不够理想。凭借会员订阅制的文生图模型Midjourney在2023年年度收入预估在3亿美元,大约是StablityAI的6倍。这与两者的用户规模形成了鲜明的对比。截至2023年11月,Midjourney已经拥有超过1640万活跃用户,而Stable Diffusion 在所有渠道的日活跃用户大约在1000万。
Stability AI商业化困难的原因主要有三点:
一是开源路线导致商业化路径不清晰。Stable Diffusion主打开源,用户可以自己基于开源代码搭建服务,未必非要依赖Stability AI,这也使公司锁定客户、自主定价变得艰难。相比之下,Midjourney这样的闭源AI图像生成产品有着简单清晰的商业化思路,用户花钱生成图片。
二是使用门槛更高。使用Stable Diffusion,需要编程知识和4GB独立显卡,技术门槛更高,对小白很不友好。作为对比,Midjourney上手就很简单了,只需要注册Discord账号,简单操作就可以得到精美高质量的图片,这可能也是大部分用户不惜花60美元支付费用的原因。
三是商业化节点滞后。比起Midjourney从一开始就主打会员付费制,Stable Diffusion的商业化的道路姗姗来迟。在Mostaque的构想里,开源模型的商业模式就是面向企业提供解决方案,即类似红帽和MongoDB,在开源版本免费的同时,通过定制化商业版本盈利。但显然,Mostaque低估了这一商业化路线的难度。
在自身商业化迟迟打不开局面的情况下,越来越多的巨头开始涌入文生图模型。比如,Meta推出了mu Edit和Video,谷歌旗下Imagen也自带了安卓系统3亿的潜在客户。亚马逊的图像生成模型——Titan Image Generator已经可供 Bedrock 上的AWS客户使用。
内忧外患之下,Stability AI的CEO和员工集体跑路就都不难理解了。
/ 02 /
行业老大换人了!Midjourney流量被Leonardo.ai赶超
那边是曾经的扛把子倒了,这边现在行业老大Midjourney的流量也被Leonardo.ai反超了。
今年1月,一款主打 AI图片合成的Leonardo.ai网站流量以18.71M的月访问量首次超越了霸榜第一的Midjourney,并在之后一直呈赶超趋势。
从平均访问停留时间来看,Leonardo ai也以12min的平均用时超越了Midhourney的10min,Leonardo ai在三个月内的用户粘性更强。
就2024年2月网站流量的各指标对比看,Leonardo ai的月访问量和独立访客的平均访问次数均已超过Midjourney。
有趣的是,Leonardo AI的底层模型就是用Stable Diffusion微调的。不过与Stable Diffusion需要Python基础和独立显卡不同,Leonardo. ai在网页端就可以免费使用。
与Midjourney相比,Leonardo. ai的优势主要体现在性价比。
现在Midjourney基础版需要10美元一月,每月仅生成 200 张图像。而Leonardo. ai的免费版每月可以生成4,500 张图像(每天150张)。此外,Leonardo. ai还提供每月10美元的年度计划,用户每月最多可以生成 8500 张图像。这样的定价显然对对小白和学生党更加友好,所以有很多博主将其称为“Midjourney平替”。
从产品能力上说,Leonardo. ai与Midjourney各有侧重,但前者支持用户自定义模型,让其绘画风格上有了更多的延展性。
具体来说,Leonardo ai偏向写实,Midjourney生成图像更加梦幻、抽象,只能输入文字版prompt,偏向艺术。
从对输入指令的还原度讲,Leonardo. ai能够根据内容生成还原度较高的图片,更加逼真写实,就像是日常拍出的照片。但是,Midjourney更加艺术、偏向油画质地。
对于更喜欢写实风格的受众,Leonardo. ai是一个更好的选择,也就是说,Leonardo ai的应用场景更加广泛,可以应用于商务、艺术、游戏、写实。而Midjourney更偏向于艺术路线,生成图像更加梦幻、色彩更丰富、质地更细腻。
比如,下图中的两位老太太,Midjourney生成图像偏向抽象类油画类艺术创作,Leonardo生成的图像在自然光线下更加真实。
除了艺术、商务、写实等更加广泛的应用场景,Leonardo. ai还支持用户自定义自己的数据和训练模型,同时有绘画、素描、插图等不同的成图风格供用户选择。在生成图像的过程中,用户可使用参数和选项调整图像,塑造风格、情绪等,也能根据需要调整分辨率、格式和质量。此外,用户还可以将自定义的模型分享给其他用户。
而Midjourney目前仅支持用户输入指令,无法调整参数、分辨率、格式等。这就极大限制了 Midjourney出图的稳定性。对很多用户来说,Midjourney出图的质量尽管很高,但是随机性太强,有时候符合自己的需求,有时候不符合,就像抽盲盒一样。
性价比又高,又能能自定义模型,“Midjourney平替”取代Midjourney自然也合情合理。
/ 03 /
行业座次变化背后,是用户需求的精细化
自生成式AI故事兴起以来,竞争一直是这个行业绕不开的话题。
但少有人注意到,不同于Chat GPT等通用AI助手已经形成的稳固格局,自2022年3月Midjourney发布开启AI作图以来,短短两年时间内,文生图模型垂直赛道就已经发生了巨变:
2022年8月,Stable Diffusion以三个月用户量增长1000万称霸市场;到后来,Midjourney通过产品迭代,在相当长时间内流量高居行业第一;到现在,Stable Diffusion陨落、Midjourney流量被Leonardo. ai反超。
换句话说,在非通用细分AI赛道里,AI产品的竞争更加激烈、趋于白热化。与通用型AI个人助理不同,文生图模型赛道用户更强调地并非体验性、趣味性和新鲜感。从长远看,用户使用模型的工具导向更强,更加强调操作简易性和出图质量。简而言之,模型生成的图像是否符合输入指令,质量高不高,上手快不快。
一年前,Midjourney因更低的技术门槛、更细腻的图像质量打败开源模型Stable Diffusion,赢得了更加广阔的用户市场。而现在,横空出世的Leonardo则凭借“模型定制化”与更细微的参数调整与Midjourney打成平手。而且,Leonardo. ai独立访客的平均访问次数和平均访问停留时间都超越了Midjourney,这意味着Leonardo. ai的用户留存能力更高,用户粘性更强。
在文生图领域产品竞争、迭代的背后,我们看到的是,愈发精细化、差异化的用户需求。从模型生成到成图质量到精细化的定制需求,人们不再满足于对AIGC热潮和技术光环的追捧,更加强调性能和使用体验。这也符合在2024年AI赛道更加细分、从模型建设涌入C端应用开发的总体趋势。
在未来,谁能胜出,谁会淘汰,都不再是棋盘上的既定数。与时俱进,从用户角度不断优化性能打造精细化、差异化的产品体验才是AI公司最后的护城河。
Prev Chapter:#微软OpenAI拟投资千亿开发AI超级计算机#
Next Chapter:#OpenAI小规模开放VoiceEngine模型#