Meta公布了他们最新的Llama使用情况
• Llama 在HuggingFace上的下载量接近 3.5 亿次。与去年同期相比,下载量增长了 10 倍多。
• Llama 在过去一个月的下载量已达 2000 万次。这使得 Llama 成为领先的开源模型系列。
• 云服务提供商对 Llama 的需求巨大。自 5 月份以来,其最大的云提供商Tokens使用量增长了一倍多。
更多数据:ai.meta.com/blog/llama-usage-doubled-may-through-july-2024/
然后Cerebras回复说他们是最快的Llama API接口
•Llama3.1-70B 每秒处理 450 个 token — 比 GPU 快 20 倍
• 每百万个Token 60 美分——超大规模Token价格的五分之一
• 完整的 16 位精度,实现完整的模型精度
• 对开发者的宽松速率限制