欧洲的OpenAI,把ChatGPT功能都复制了。
Mistral AI大模型平台Le Chat新增Canvas、联网搜索、上传PDF等ChatGPT同款功能,而且全都免!费!
三大主流大模型产品的功能,现在可以一站式访问。
而且还官宣和知名绘图模型Flux达成合作,在Le Chat平台提供在线生图功能,同样是不收一分钱。
经量子位简单实测发现,搜索、文档总结和绘图这些新功能都支持中文。
Mistral的CEO Arthur Mensch表示,这次的新版Le Chat是一个里程碑,标志着该平台已经成为“更成熟的动物”。
ChatGPT同款功能免费用
在Mistral的官方平台Le Chat(看上去是chat,但实际上是法语的“猫”)上,免费上新了一系列ChatGPT同款功能。
从Mistral官方发布的表格来看,除了o1和语音对话,其他功能基本都安排了。
其中也包括OpenAI最新上线的高级界面Canvas,在ChatGPT中该功能目前还是会员专属。
在Le Chat的Canvas当中,可以单独展示生成的文稿,而不必再从对话中手动提取。
代码也可以如法炮制,并支持实时预览,还能选中局部代码要求做出修改。
再来是联网搜索,和ChatGPT一样,Le Chat可以根据问题进行在线搜索总结,并附上来源信息,而且速度非常快。
另外,现在的Le Chat已经能够处理复杂的PDF文档和图像,并进行分析和总结,包括其中的表格、图表、文本、公式、方程等内容。
在下面的示例中,Le Chat对爱因斯坦等人1935年撰写的著名量子纠缠论文进行了信息提取、概括和语义理解。
除了分析图片,最新的Le Chat也支持了文生图,不过Mistral暂未自研此类模型,而是选择了与Flux合作,接入其模型。
还可以创建并在对话中@智能体,智能执行一些任务,但是目前创建页面只有法语……
不过,目前Mistral已经发布的模型尚未拓展至语音模态,因此ChatGPT中的高级语音对话功能,Le Chat是没有的,另外也没有桌面客户端。
所以,虽然Mistral此举被视为在功能上对ChatGPT的追赶,但离真正追上还存在一定的距离,不过倒是胜在免费(手动狗头)。
多模态模型大号版上线
在Le Chat中提供图像分析功能的,正是今天同时发布的大号版多模态大模型Pixtral Large。
它拥有124B参数量,包括一个123B参数的解码器和一个1B参数的视觉编码器,此前Mistral曾经发布了小号的12B版本。
上下文窗口为128k,相当于可以一次性处理至少30张高分辨率图像。
功能上Pixtral Large支持多语言OCR识别,并在此基础上进行推理。
也能看懂图表并分析其中的趋势。
同时,Pixtral Large在训练的过程当中还考虑到了前端应用,对此Mistral的CEO Arthur Mensch解释道:
从Mistral的成长经历中我们意识到,要想创造好的AI体验,需要模型和产品界面的协同设计。
Pixtral就是一个很好的例子,它在训练过程中充分考虑了前端应用。
而至于模型本身的性能,按照Mistral的说法,Pixtral Large是目前的SOTA视觉模型。
在MMMU、MathVista、ChartQA等六个不同任务类型的数据集中,Pixtral Large取得了超过或接近与Gemini-1.5 Pro和GPT-4o的成绩,相对Claude-3.5 Sonnet优势更为明显,在开源模型中更是远远超过Llama-3.2 90B。
此外Mistral团队还以GPT-4o作为评价者,使用其自己开源的MM-MT-Bench基准进行了测试,结果Pixtral Large领先于其他模型,包括既当裁判员又当运动员的GPT-4o。
有网友看了Pixtral的成绩后表示,Benchmark很快又需要更新了。
不过在Reddit上,有人提出质疑,表示Pixtral可能并没有达到SOTA水准——
Mistral官方只将Pixtral和少数模型做了比较,其中开源模型只比较了Llama-3.2 90B。
但实际在多个数据集上,Qwen2-VL(最大版参数量72B)的表现比Pixtral更强。
同时在部分数据集中,Pixtral的测试成绩也不如Molmo(由西雅图一家名为Ai2的非营利研究机构开发)。
而且有人实测之后说,在他测试的含有日文的图片中,Pixtral Large的识别能力还不如Qwen的7B版本。
那么,你觉得Mistral的新产品到底好不好用呢?