AI

当前位置：首页 > 技术圈 > AI

商汤甩出大模型豪华全家桶！秀拳皇暴打GPT-4，首晒“文生视频”，WPS小米现场助阵

更新时间：2024-04-24 10:56:44 编辑：管理员浏览：342

4月23日报道，今日，商汤科技全新升级“日日新SenseNova 5.0”大模型体系，综合能力全面对标GPT-4 Turbo。

AI数据荒下的创业众生相：盗用GPT-4生成数据训练模型，引发投资人担忧

同时，商汤在业界首次推出“云、边、端”全栈大模型产品矩阵，包括商汤端侧大模型、端云协同解决方案，以及面向金融、代码、医疗、政务等领域的边缘产品“商汤企业级大模型一体机”。

“日日新SenseNova 5.0”采用混合专家架构，基于超过10TB tokens训练、覆盖大量合成数据，推理时上下文窗口可支持200K，主要增强了知识、数学、推理、代码能力，在主流客观评测上达到或超越GPT-4 Turbo性能。

AI数据荒下的创业众生相：盗用GPT-4生成数据训练模型，引发投资人担忧

现场演示了“日日新5.0”与GPT-4多项功能对比，包括创意写作、逻辑推理、文生图、图像理解、根据图片计算食物热量等。

为了秀端侧大模型的肌肉，商汤科技还“玩”起拳皇。一开始绿衣玩家GPT-4略占上风，但很快就被红衣玩家SenseChat-lite各种连招打得反应不过来，最终红方取胜。

AI数据荒下的创业众生相：盗用GPT-4生成数据训练模型，引发投资人担忧

商汤董事长兼CEO徐立说，不是模型能力有多强，是在不同的适用场景下，小模型的决策速度快，当大模型还在计算，小模型已经完成了判断并出拳，不管它的拳是不是最优的，都实实在在地打到了对手的身上。

其端侧大模型实现业内最快推理速度，旗舰平台最高达109.5字/秒，而人眼最快阅读速度仅为20字/秒，现场演示的处理对话、图像处理速度快过云端。商汤还正式发布端侧业务SDK，可适配多款高通骁龙、联发科天玑芯片。

AI数据荒下的创业众生相：盗用GPT-4生成数据训练模型，引发投资人担忧

企业级大模型一体机支持千亿模型加速和知识检索硬件加速，相比行业同类产品，千亿大模型推理成本可节约80%。小浣熊·代码大模型一体机轻量版每台售价35万元起，单台支持100人团队使用，每日使用成本低至每人4.5元。

AI数据荒下的创业众生相：盗用GPT-4生成数据训练模型，引发投资人担忧

同时，商汤发布了基于昇腾原生的行业大模型，与华为共同打造面向金融、医疗、政务、代码等大模型产业生态。

AI数据荒下的创业众生相：盗用GPT-4生成数据训练模型，引发投资人担忧

在自身应用方面，商汤“日日新SenseNova 5.0”在秒画、如影、格物、琼宇、大医、小浣熊家族等产品均有重要更新。

还有One More Thing——文生视频生成平台，徐立带来了三段完全由大模型生成的视频，并着重强调对人物、动作、场景的可控性。

AI数据荒下的创业众生相：盗用GPT-4生成数据训练模型，引发投资人担忧

未来，通过输入一段文字描述即可生成一段视频，而且人物的服饰、发型、场景都能根据预先设定，保持视频内容的连贯性和一致性。

金山办公CEO章庆元、海通证券副总经理兼首席信息官毛宇星、小米集团小爱总经理王刚、阅文集团筑梦岛总经理葛文兵均来到现场，分别作为办公、金融、出行、IP角色等行业的代表进行分享。几位客户代表的发言都很有料，或连爆金句，或干货频出，对行业发展很有参考性。

一、文科数理能力均显著提升，全面对标GPT-4 Turbo

商汤董事长兼CEO徐立首先提到Scaling Law尺度定律，即随着模型参数变大、数据量变大、训练时长加长，算法性能会越来越好。

还有两条隐藏假设，一是可预测性，在小尺度上做很多实验，跨越5~7个数量级尺度依然保持性能的准确预测；二是保序性，在小尺度上验证的性能优劣，在大尺度上依然保持着优劣。

这可以指导在有限的研发资源上找到最优模型架构和数据配方，让大模型能最高效地学习。

AI数据荒下的创业众生相：盗用GPT-4生成数据训练模型，引发投资人担忧

基于实验结果，小模型在优化数据的情况下，性能可逼近甚至超越跨数据级的大模型。

“商汤在尺度定律的指导下，会持续探索大模型能力的KRE三层架构（知识-推理-执行），不断突破大模型能力边界。”徐立说。

AI数据荒下的创业众生相：盗用GPT-4生成数据训练模型，引发投资人担忧

为了解决数据集质量的瓶颈，日日新5.0训练用到10T+ tokens的中英文预训练数据，进行了精细设计的清洗处理，形成高质量基础数据。

此外，合成思维链数据，是激活大模型的强理解推理能力的关键。商汤在预训练过程中大规模采用数千亿tokens量级的逻辑型合成数据。

“日日新5.0”在中文理解、知识储备、数理逻辑、代码编程等方面的能力明显提升，在主流客观评测上达到或超越GPT-4 Turbo。

AI数据荒下的创业众生相：盗用GPT-4生成数据训练模型，引发投资人担忧

在文科能力方面，“日日新5.0”的创意写作、推理、总结能力均大幅优化，相同的中文知识注入后，可获得更好的理解总结及问答。

基于大量中文语料的构建，在开放式写作，比如让它写2022年基于《红楼梦》给匾额题名来探讨创新的高考作文，可以看到GPT-4写作风格比较生硬：“在学习上……在工作中，……”；“日日新5.0”则写得更加发散，从诗经楚辞到文化革古鼎新，再到互联网新知识的融合。

AI数据荒下的创业众生相：盗用GPT-4生成数据训练模型，引发投资人担忧

在理科能力方面，“日日新5.0”的数理、代码及推理能力达到业内领先水平。

商汤展示了一个数学题示例：妈妈给圆圆冲了一杯咖啡，圆圆喝了半杯后，加满水，她又喝了半杯后，再加满水，最后全部喝完，问圆圆总共喝掉多少咖啡和水。如果理解成总共加了两次半杯水即一杯水，那么答案是一杯咖啡一杯水。如果从每次喝掉多少水来算，计算则比较复杂。

AI数据荒下的创业众生相：盗用GPT-4生成数据训练模型，引发投资人担忧

“日日新5.0”理解完后，得出跟刚才解读一致的答案。而GPT-4把事情搞复杂了，得出的答案是喝了19/20杯咖啡和1+4/5杯水。

还有一个简单的逻辑情景题，13个小朋友玩老鹰抓小鸡，抓了5只小鸡，问还剩几只。GPT-4不理解老鹰抓小鸡游戏中有1人要当老鹰，给出的答案是8只。“日日新5.0”则给出正确答案。

在多模态能力方面，其在多模态大模型权威综合基准测试MMBench中综合得分排名首位，在多个知名多模态榜单中取得领先成绩。

AI数据荒下的创业众生相：盗用GPT-4生成数据训练模型，引发投资人担忧

商汤将“日日新5.0”的文生图能力与几个业界最好的模型做直观对比。

AI数据荒下的创业众生相：盗用GPT-4生成数据训练模型，引发投资人担忧

徐立说，文生图的一个难点是如何将真正的理解与合成放在一起。其他主流文生图模型对于文字嵌入到图像中都有一定缺失，日日新5.0则能表现得非常好，有比较完整的指令跟随生成效果。

在应用产品层面，“日日新5.0”支持高清长图的解析和理解以及文生图交互式生成，还可以实现复杂的跨文档知识抽取及总结问答展示。

长图上会有很多信息点，但推到多模态窗口中，往往图像分辨率过高，上传不了。对此，商汤给出了非常大的分辨率接口，支持用户对长图等级性提问，包括描述图片细节、总结标题内容等。

AI数据荒下的创业众生相：盗用GPT-4生成数据训练模型，引发投资人担忧

再比如打车应用界面截图，它可以识别捕捉到其中的时间、车辆距离、文字提示、车辆信息、功能按钮、推广活动等核心信息。

AI数据荒下的创业众生相：盗用GPT-4生成数据训练模型，引发投资人担忧

它也可以化身卡路里助手，拍一张早餐照，让它算算一共多少热量。

AI数据荒下的创业众生相：盗用GPT-4生成数据训练模型，引发投资人担忧

相比GPT-4，日日新5.0在理解中式餐饮内容中表现更好。

小浣熊家族是基于商汤大语言模型打造的AI原生生产力系列工具，覆盖软件开发、数据分析、编程教育等多个场景，旨在提升工作效率，已推出代码小浣熊、办公小浣熊等成员。输入商汤小浣熊网页截图，“日日新5.0”可以进行详细描述。

AI数据荒下的创业众生相：盗用GPT-4生成数据训练模型，引发投资人担忧

再让它根据前两个小浣熊，来生成一张新的小浣熊形象，它会先解释自己的设计思路，然后生成对应形象。而对GPT-4进行完全相同的输入，GPT-4生出的形象毫不相关，并没有将前两个小浣熊形象融入到它的设计理念中。

AI数据荒下的创业众生相：盗用GPT-4生成数据训练模型，引发投资人担忧

通过用户的自然语言输入，办公小浣熊可自动将数据转化为有意义的分析和可视化结果。比如导入数据库文件，数据库里只有英文名，而用户输入查找的是中文名，第一波输入后没查到，接着告诉办公小浣熊“肯定有的你再找找”，它就会进行思考，再度检查和筛选，找出模糊匹配的信息。

AI数据荒下的创业众生相：盗用GPT-4生成数据训练模型，引发投资人担忧

它还可以检查数据库中多个表格的交叉信息来汇总计算，并生成直观的可视化图表乃至雷达图。

AI数据荒下的创业众生相：盗用GPT-4生成数据训练模型，引发投资人担忧

二、端侧模型跨级领先，端云协同方案大降推理成本

天下武功，唯快不破。

商汤推出SenseChat-Lite版本端侧⼤模型，可落地手机、平板、VR眼镜、智能汽车等端侧。

商汤日日新·端侧大语言模型的推理速度更快，首次加载低于0.4秒，解码⼤于30tokens/秒，号称“同等尺度性能最优，跨级尺度全面领先”。

AI数据荒下的创业众生相：盗用GPT-4生成数据训练模型，引发投资人担忧

人眼最快阅读速度为20字/秒，而该模型在中端平台实现18.3字/秒的平均生成速度，旗舰平台更是达到78.3字/秒，最高能达到109.5字/秒。

AI数据荒下的创业众生相：盗用GPT-4生成数据训练模型，引发投资人担忧

商汤通过SDK形式为终端用户提供量化部署工具链，数据处理均在终端设备上完成，有效保障⽤户隐私安全。

商汤还推出端云协同解决方案，进行高性能计算，处理复杂的任务。

AI数据荒下的创业众生相：盗用GPT-4生成数据训练模型，引发投资人担忧

该方案支持在不同的设备和平台上运行，使得模型可以在各种终端上进行部署和应用，同时实现在离线状态下仍能保障服务和应用。

其端云协同⽅案性能指标上，在综合考试、语言、知识考试、推理等17个测试集下，平均性能接近云侧，但80%的推理将在端侧处理，因此节省了大量云侧推理成本，模型能够及时适应变化的环境和需求，保持高性能和准确性。

现场演示了端侧离线运行商量平台，比如写请假申请、将长篇大论总结成一句话。基本上眼睛还没看清，模型已经生成出答案。

AI数据荒下的创业众生相：盗用GPT-4生成数据训练模型，引发投资人担忧

其端侧扩散模型同样实现了业内最快推理速度。

AI数据荒下的创业众生相：盗用GPT-4生成数据训练模型，引发投资人担忧

1B模型支持在高通、联发科高端平台上端侧离线运行，端侧LDM-AI扩图技术在主流平台上推理速度不到1.5秒，比友商云端app快了10倍，可在数秒内生成1200万像素及以上的高清大图，并支持在端侧快速进行等比例扩图、非等比例扩图、旋转填充扩图等多种图像编辑功能。

AI数据荒下的创业众生相：盗用GPT-4生成数据训练模型，引发投资人担忧

端侧智能体也很方便，能够自动执行一连串复杂指令，比如打开邮箱-查看邮件-把邮件移动到指定文件夹-打开微信-进入指定微信群聊-在群公告中发布指定内容。

AI数据荒下的创业众生相：盗用GPT-4生成数据训练模型，引发投资人担忧

商汤宣布端侧业务SDK正式发布，适配多种主流高通骁龙、联发科天玑芯片，支持XR、PC、车载、安卓/iOS移动全平台。

三、发布企业级大模型一体机，大模型推理成本可节约80%

面向边缘侧，商汤面向金融、医疗、政务、代码四个行业推出商汤企业级大模型一体机。

一体机同时支持千亿模型加速和知识检索硬件加速，实现本地化部署，即买即用，相比行业同类产品，千亿大模型推理成本可节约80%；检索大大加速，CPU工作负载减少50%，端到端延迟减少1.5秒。

AI数据荒下的创业众生相：盗用GPT-4生成数据训练模型，引发投资人担忧

金融大模型一体机采用国产双路主控CPU及四颗智算加速卡，单机能够满足30人同时使用，支持万量级的金融文档管理和检索，在万级文档知识库规模下检索准确率超过90%，满足金融部门的精准检索要求。

AI数据荒下的创业众生相：盗用GPT-4生成数据训练模型，引发投资人担忧

医疗大模型一体机是软硬一体私有化医疗大模型解决方案，针对智能问诊、导诊、病历结构化、影像报告解读等场景，支持智能调整回复内容的语言风格、详略程度、格式要求等，一键自定义专属医疗场景，实现小成本高精度的医疗大模型部署。

AI数据荒下的创业众生相：盗用GPT-4生成数据训练模型，引发投资人担忧

政务大模型一体机是面向政务咨询场景的边缘大模型产品，采用国产双路主控CPU及四颗智算加速卡，支持万量级的政策文档管理和检索，面向有政务咨询需求的部门单位, 辅助更高效地处理与法律法规、政策标准相关的咨询和决策任务。

AI数据荒下的创业众生相：盗用GPT-4生成数据训练模型，引发投资人担忧

小浣熊·代码大模型一体机轻量版是面向软件开发的边缘大模型产品，是一套安全可靠、开箱即用、高性价比的企业软件研发软硬件一体化解决方案，能够帮助开发人员更高效地编写、理解和维护代码，提高软件开发的效率和质量。

AI数据荒下的创业众生相：盗用GPT-4生成数据训练模型，引发投资人担忧

GPT-4

收藏打印

上一篇：马斯克：人形机器人Optimus可能在明年年底前开始出售

下一篇：Adobe推出新版Photoshop全面集成AI

AI

商汤甩出大模型豪华全家桶！秀拳皇暴打GPT-4，首晒“文生视频”，WPS小米现场助阵

相关内容

点击排行

文章归档

评论排行榜

热门标签