IT之家 9 月 9 日消息,以提供新闻、体育和娱乐照片授权闻名的全球最大的商业图库 Getty Images 上周宣布推出高画质照片样本训练数据集,供开发者开发和训练 AI 模型使用。
IT之家获悉,该样本数据集包含 3,750 张照片,分为商业、教育、医疗健康、运动与健身、物品与物体、插图、图标等 15 个类别。数据集提供多种主题的高质量视觉内容,可用于训练机器学习和 AI 模型,开发多种应用场景。
▲ 相关图片选集
目前,这一数据集已在 Hugging Face 上线(点此访问),不过用户需同意服务条款并提供联系方式,才能免费访问该数据集。
Getty 希望通过这个免费样本数据集吸引企业和开发者使用其付费授权服务。Getty Images 声称自家拥有超过 5.72 亿张照片,其中 2 亿多张可用于商业用途。每张照片附有结构化的元数据,包括年龄、性别等信息,每张图片平均有 50 个关键词,可保障用户安全训练模型,免受侵权诉讼风险。