美图AIGC布局再进一步，大模型3.0让用户掌握主动权

2023-10-18 10:20:18 浏览：198 作者：管理员

这年头，是个企业都要搭上AIGC的顺风车。

自从ChatGPT问世，各种AI视觉大模型公司也像雨后春笋般涌现。数据显示，国内目前已发布的AI视觉大模型超过30个，还有100支以上的创业团队在路上。但仔细观察会发现，大部分大模型只是描述了一个“完美”的概念。

它们的产品没怎么打磨过就匆忙上市，用户真实的使用体感很差。尤其是在企业生产环节，许多大模型与工作流的结合仍在初步探索阶段。

很长一段时间里，AI视觉大模型的都是空有其名，从企业到用户，都在等待一场真正搅动风雨的暴雨洗礼。

最近，锌财经发现美图公司举办了15周年生日会。生日会上，创始人兼CEO吴欣鸿官宣了一件大事，美图自研AI 视觉大模型MiracleVision发布3.0版本，最新的大模型将运用到美图旗下所有影像与设计产品，助力电商、广告、游戏、动漫、影视五大行业。

MiracleVision 3.0版本的核心能力可以拆分为“奇思妙想”和“智能创作”两部分，除了输入文字生成相应图像、输入涂鸦秒变大作这些基本操作外，大模型的“智能脑补”和精准控制能力都进一步加强，降低绘图、修图的门槛，实现创作平权。

美图15周年生日会直播

对于美图的种种新动作，二级资本市场也已经做出来自己的回答。近几个月来，美图公司的股价持续呈现出上升趋势，截至目前总市值突破172亿港元。

不难发现，在这场对AIGC探索的长跑中，美图拉着用户跑到了最前面。

01.100天的进化，AI技能已达next level

美图上一次有更新动作，还在100天前。

今年6月，美图首次发布的视觉大模型MiracleVision，已经给整个行业带来惊喜，它能从绘画、设计、摄影等视觉创作场景反推技术演化，尤其擅长亚洲人像摄影、国风国潮等生成方向。但当时，吴欣鸿直言：“AI带来很多机会和挑战，但这个机会不一定是我们的机会，而挑战是实实在在存在的。我还是一个如履薄冰的状态。”

这种对技术的重视度和危机感，让美图大模型在很短的时间里再次做到迭代升级。吴欣鸿介绍说，三个月前，MiracleVision绘画水平还停留在初级阶段，如今3.0版本已经能描绘出真实细腻的画面细节。

锌财经亲身体验了以MiracleVision3.0为内核的AI视觉创作工具WHEE。在对话框中输入“一个小女孩”后，平台会提供智能联想，把关键词补全为“儿童画，小女孩，纯真的笑容，绿色草地，高分辨率，卡通风格，可爱，阳光明媚，水彩效果”，设定完基本参数，再等待数秒后，生成了4张画面内容各异的小女孩图像。

文生图截图

具体来看，这些画像注重细节勾勒，画面精致符合美学结构，人物效果栩栩如生，甚至有合理多变的光影效果，氛围感拉满。

一般用户可能不太懂有关绘画、照片的专业名词，比如光影效果、质感、风格、图片质量等，美图的“奇思妙想”能辅助没有美术功底的用户，提供创意灵感。如果有更专业的需求，MiracleVision的“提示词精准控制”功能，还可以轻松实现近景、远景、顺光、逆光等生成效果。

“智能创作”是美图办成的又一件大事。MiracleVision的“深化创作”功能，能进一步丰富作品细节和提升表现力；“AI画面扩展”功能让作品尺寸更大、细节更丰富；“局部修改”功能，可以指哪改哪，对部分画面进行精准修改与调整；“分辨率提升”功能可以生成高清大图，让细节表现、色彩展示、物体辨识更加精准和生动。

可以看到，这次美图大模型的更新，试图从根源上解决图像的精确性和可控性问题，让AI视觉生成上了一个台阶。

02.更适合工作场景的提效工具

一定程度上，把AI视觉大模型用到工作流程中，是比单纯做好视觉呈现更困难的事。虽然生活场景和生产力场景技术底层是共通的，但实际应用场景很不一样，需要做很多精细化的适配工作。

这次美图MiracleVision3.0版本的推出，更大的意义就在于，它能落地电商、广告、游戏、动漫、影视五大行业，来帮助工作流提效。

就拿电商行业来说，做物料一直是头大的事情。很多鞋服企业每年光是找摄影团队、模特拍摄上能花掉几十万甚至上百万，而且真人模特拍摄是一锤子买卖，后期想要再调整修改，也会很麻烦。

如今在美图设计室里，商家可以实现从涂鸦生成线稿、线稿上色、商品图、模特试穿图，再到电商物料输出的全过程，极大提高生产效率、降低成本。

用“AI鞋服”工具可以完成初步的商品图，选择线稿参考图、材质、文字描述后，一次性能生成8张图片，生成结果也能二次微调。

美图设计室“AI鞋服”截图

然后在“AI商品图”上，能把刚做好的商品图自动抠图，选择合适的场景，进行细节优化。最后再在“AI海报”看到海报效果。

美图设计室“AI商品图”截图

美图还研发了“AI模特试衣”工具，上传人台图或真人模特图后，能定向选择保留或去除哪部分商品内容，然后在模特库里挑选所需的AI模特，性别、人种、肤色都可以自定义。稍等片刻，就会生成AI模特试衣图，如果对效果不满意，还能换模特，重新编辑。

美图设计室“AI模特试衣”截图

不难发现，美图视觉大模型的出现，形成了AI原生工作流。在创意脑暴后，AI能快速生成各种创意视觉方案，确定最终创意后，AI又能快速把创意细化，完成最终作品。因此，原本会延续一周以上的工作时间，被压缩到三天，甚至更短。

在吴欣鸿看来，AI视觉大模型的本质，是无穷无尽的视觉创意库，应用层则是内容提取器，“根据用户的需求，从这个巨大的创意库中提取所需要的内容，让用户在特定场景中使用。”

将视觉大模型3.0版本做到的精确性和可控性赋能垂类工作场景，为行业降本增效，这是美图的目标。

03.与AIGC高度融合的未来

时至今日，美图与AIGC已经深度绑定了。

早两个月，美图公布2023中期业绩，上半年实现总收入12.61亿元，同比增长29.8%；归母净利润1.51亿元，同比增长320.4%。美图公司月活跃用户数达2.47亿，同比增长2.5％。具体分业务来看，影像与设计产品收入高达6.02亿元，同比增长62.2%；美业解决方案的收入2.86亿元，同比增长31.1%。