谷歌于 8 月 27 日发布博文,宣布旗下 Gemini AI 支持更多类型的文件,通过分析、摘录、洞察文档内容,为用户提供更优质的 AI 服务。
谷歌表示拥有 Gemini Business、Enterprise、Education 或 Education Premium 许可证的 Google Workspace 用户,现在可从 Google Drive 或本地设备上传各种文件到 Gemini(gemini.google.com):
电子表格:Gemini AI 现在可以处理 CSV、XLSX 和 ODS 等格式的电子表格,使用户能够分析数字数据、跟踪趋势,并从财务模型、销售报告等生成洞察力。
演示文稿:用户现在可以上传 PPTX、PDF 和 KEY 等格式的演示文稿,让 Gemini AI 可以提取要点、总结内容并识别图表和图像等视觉元素。
图像:Gemini AI 现在可以分析 JPEG、PNG 和 GIF 等格式的图像,提取文本、识别对象并为视觉内容提供上下文。
音频:用户现在可以上传 MP3、WAV 和 FLAC 等格式的音频文件,让 Gemini AI 能够转录语音、识别发言人,并总结访谈、播客和讲座中的要点。
视频:Gemini AI 现在可以处理 MP4、MOV 和 AVI 等格式的视频文件,从演示文稿、纪录片和培训视频中提取脚本、识别场景并总结关键事件。
Gemini 可以根据用户输入的提示词,更有针对性地分析用户上传文件,总结复杂的主题、识别趋势和洞察力,以及改进写作和文档组织的建议,帮助用户提高理解、研究和写作能力。