消息称抖音多款AI产品开启内测
太平洋对岸的ChatGPT,燃起了张一鸣的AI梦。在过去一年多的光景里,抖音集团的AI底色越来越浓。
据Tech星球独家消息,抖音集团多部门加大AI技术研发,并调集多位高管跟进,目前已有多款AI产品开启内测。
其中,Flow部门是抖音在AI技术研究和产品研发的排头兵,进展最快。
该部门已经推出了豆包(Cici)、扣子(Coze)等AI产品外,另有AI角色互动APP“话炉”、AI产品“PicPic”正在内测和研发阶段。
“话炉”支持用户和AI智能体进行故事聊天、创作,也支持用户创建AI虚拟角色,打造全新智能体。
测试中的“话炉”界面,以产品最终上线为准 图源:Tech星球
PicPic则是Flow即将推出的,或为图片智能创作方面的产品,目前仍处于研发阶段,最终效果需要时间等待。
据了解,Flow部门业务带头人为抖音大模型团队的负责人朱文佳,技术负责人为抖音技术副总裁洪定坤,产品线负责人为抖音产品与战略副总裁朱骏。
另外,飞书产品副总裁齐俊元近期也转岗至Flow。
Flow部门之下还有多个AI产品团队,其中,Bot Studio团队负责最近刚在国内上线的“扣子”,以及国外的Coze;
豆包和海外项目"Cici"的产品团队规模已达到约50人,其中有十余人负责海外产品“Cici”的开发。
一位消息人士透露,Flow各业务组之间都非常卷,而且还缺人,从去年11月开始,Flow批量开放“活水”岗位,吸纳其他业务部门的人员转岗。
除了Flow,抖音集团的其他重要业务部门也正在加码AI产品服务,包括抖音电商、抖音生活服务、火山引擎、巨量引擎、稀土掘金、今日头条、大力教育、剪映等。
值得关注的是,近期抖音集团CEO张楠辞去集团CEO一职,未来将把精力聚焦在剪映的发展上。张楠还在发给剪映的内部信中特别提到了“AI图像生成技术正在内容创作工具行业带来巨大的变化和可能性。”
图源:前抖音CEO张楠的剪映内部信
接近剪映的人士透露,过去一年,张楠已经把绝大多数精力倾斜到剪映相关业务上,并亲自带队寻求在AI辅助创作上有所突破,即将推出一个AI生图和视频的产品。
去年11月,剪映测试了一个名为“Dreamina”的AI工具,可以根据一段文字生成四幅由AI生成的创意图。
曾有消息人士称,未来Dreamina会用于抖音的图文或短视频的内容创作,丰富抖音在AI创造方面的内容库。
张楠对剪映的全力投入,势必将进一步推动该部门AI技术的迈进。
目前,抖音集团在国内外已上线十余款AI产品,除了上述提到的产品,还有“AI搜”、 AI情绪伴聊机器人的“抖音小晴”、 针对电商内容创作的产品“即创”、AI工具合集小悟空(ChitChop)、 AI 剧情互动平台BagelBell等。
搜索、社交、创作、电商,张一鸣正在编织一张巨网,意欲捕获一条引领行业变革的“大鱼”。
互联网大厂扎堆AI赛道
一年多以前掀起行业AI风暴的OpenAI似乎打开了潘多拉魔盒,众多投资者、行业巨头争相涌入这一风口。
去年,众多互联网巨头相继推出大模型,例如百度的文言一心、阿里的通义千问、抖音的云雀大模型等。
不过对于AI时代来说,大模型只是一个起点。百度创始人李彦宏曾表示:“人类进入AI时代的标志,不是产生很多的大模型,而是产生很多的AI原生应用。”
AI和用户的连接,成为当下各大厂商需要面对的课题。
“用户为先、AI驱动”是阿里的两大战略重心。阿里集团CEO吴泳铭曾表示,希望将集团旗下业务的大量用户场景全部变成AI技术的应用场,带来突破性的用户体验和商业模式。
此前,阿里旗下淘宝天猫推出一系列AI工具,其中包括面向商家的模特图智能生成、官方客服机器人等工具,以及面向消费者的“淘宝问问”等。
淘宝问问 图源:淘宝
不仅仅是电商领域,阿里云、钉钉、夸克等业务部门也在持续扩展AI应用。
就在春节前夕,阿里云通义千问APP上线多项免费新应用,涵盖全家福、拜新年、万物成龙等图像生成,以及“全民舞王”图片转视频生成功能等。“全民舞王”支持用户利用AI生成自己的拜年舞蹈视频,引发一众网友跟风模仿。
腾讯方面,其混元大模型规模正在不断扩大。腾讯集团副总裁蒋杰曾透露,腾讯内部超180项业务已经接入腾讯混元大模型进行内测。
目前腾讯已经发力了“AI+社交”与“AI+音乐”等方向,推出了AI聊天产品“未伴”,以及发布自研AI通用作曲框架XMusic。
在今年1月的2023腾讯年会演讲上,腾讯董事会主席、首席执行官马化腾谈到了AI,他表示,腾讯已经跟上了第一阵列,不算最领先,至少没有太落后。“短期内一两年内我感觉不会有一个纯原生AI大的应用,应该还是要结合到我们的所有产品里面效率提升等。”
百度方面,文言一心大模型用户累计数量已经超过1个亿。在去年10月,文心大模型4.0发布,并开启邀请测试。李彦宏表示,这是迄今为止最强大的文心大模型。
图源:腾讯网
去年双11,百度生成式AI大规模应用,百度优选更是凭借数字人直播带货模式,助力直播GMV同比增长高达740%。
京东方面,已经依托于其自研的言犀大模型,在消费导购、商家经营、客服售后、医疗问诊等多个供应链场景中试点接入。
拼多多也已经开始组建大模型团队,探索大模型在客服、对话等场景下的应用,且会拓展至其TEMU智能客服、搜索、推荐等业务场景。
此外,快手去年推出了“AI玩评”“AI小快”“快手AI对话”等多个AI功能。其中,快手用户使用“AI玩评”月均生成图片超过5亿次。快手还推出了AIGC数字人解决方案“快手智播”,支持快手用户快速制作自己的数字孪生。
小红书去年组建了独立的大模型团队,曾推出“Trik”的AI创作应用、一键生成配图的“此刻”、“Davinic”(达芬奇)的AI聊天功能等。其中“Trik”因版权争议而无法下载。
先是大模型,到如今各种各样的AI产品,当下AI赛道正值百花齐放的时节,电商、社交、办公等场景和AI的融合应用正在进一步推广。
同时,更多产品的涌现、更多对手的加入,也意味着优胜劣汰、适者生存的局势正在加剧。
张一鸣的AI梦仍面临挑战
在去年4月,张一鸣在2023年公开信中指出,抖音无法错过AGI(通用人工智能),他确信AGI是抖音TikTok在全球发现新的增长机遇不可或缺的伙伴,它可以解决抖音的第二曲线增长困境。
但从行业角度来看,抖音入局AI大模型的时间较晚,已经明显落后于百度、阿里等科技巨头。
在今年1月的抖音2024年全员会上,梁汝波直言,抖音对于大模型领域的反应过于迟钝,直到2023年中才出现跟GPT相关的讨论,而GPT-1在2018年就发布了,且业内做的比较好的大模型创业公司也基本在2018-2021年间创立。
不仅如此,一向低调行事的抖音大模型也曾被推上风口浪尖。
去年年底,有媒体报道称,“抖音使用OpenAI的技术,用以打造自己的大模型。”随后不久,OpenAI发言人尼克·菲利克斯确认,在调查期间暂停抖音账户。
对此,抖音回应称,公司使用OpenAI的技术来帮助开发自己的人工智能大模型,符合这家美国公司的服务条款,并未涉及利用OpenAI技术构建竞争性的产品。
一家总部位于美国的AI大模型开发商透露:“OpenAI暂停抖音的访问,本质上还是出于对AI竞争的担忧。”
竞争正在不断加剧,抖音在AI赛道还有很长的路要走,这背后需要资金储备、算力资源、数据积累、技术研发等方方面面的支撑维系。
据悉,OpenAI的ChatGPT从成立到产品落地,花了近8年时间。而抖音从去年才开始做,但不可否认的是,抖音的算力资源、短视频算法、月活超7亿的用户数据等,也都是它逐梦AI赛道的有利优势。
而与此同时,竞争对手也在不断进步。OpenAI最近又推出了文本生成视频模型Sora,再次引发业界关注。
OpenAI研究科学家比尔·皮布尔斯在X上披露,Sora支持同时生成多个并排在一起的视频。同时,Sora生成视频的流畅性、稳定性以及光影运动等细节方面能力有了很大提升。
OpenAI研究科学家比尔·皮布尔斯发文 图源:X平台
继文字生成和图像生成后,视频生成技术再次迎来突破。华泰证券发布研报称,OpenAI发布文生视频模型Sora,AI视频进入大规模应用前夜。
AI时代的发展正在日新月异,抖音的未来必将迎来更多考验。
去年5月初,《中国企业家》报道称,张一鸣忙于研究OpenAI的一系列论文,并且常常读至深夜。一位接近他的人士表示,“他想搞明白,太平洋对岸究竟发生了什么”。
如今来看,张一鸣要做的功课还有很多。
Prev Chapter:#马斯克称特斯拉视频生成技术全球第一#
Next Chapter:Sora带来的四点启发