AI

当前位置：首页 > 技术圈 > AI

谷歌打磨Gemini AI技能：扩充支持文件类型、提高文档洞察力

更新时间：2024-09-01 09:25:31 编辑：管理员浏览：223

谷歌于 8 月 27 日发布博文，宣布旗下 Gemini AI 支持更多类型的文件，通过分析、摘录、洞察文档内容，为用户提供更优质的 AI 服务。

谷歌表示拥有 Gemini Business、Enterprise、Education 或 Education Premium 许可证的 Google Workspace 用户，现在可从 Google Drive 或本地设备上传各种文件到 Gemini（gemini.google.com）：

电子表格：Gemini AI 现在可以处理 CSV、XLSX 和 ODS 等格式的电子表格，使用户能够分析数字数据、跟踪趋势，并从财务模型、销售报告等生成洞察力。

演示文稿：用户现在可以上传 PPTX、PDF 和 KEY 等格式的演示文稿，让 Gemini AI 可以提取要点、总结内容并识别图表和图像等视觉元素。

图像：Gemini AI 现在可以分析 JPEG、PNG 和 GIF 等格式的图像，提取文本、识别对象并为视觉内容提供上下文。

音频：用户现在可以上传 MP3、WAV 和 FLAC 等格式的音频文件，让 Gemini AI 能够转录语音、识别发言人，并总结访谈、播客和讲座中的要点。

视频：Gemini AI 现在可以处理 MP4、MOV 和 AVI 等格式的视频文件，从演示文稿、纪录片和培训视频中提取脚本、识别场景并总结关键事件。

Gemini 可以根据用户输入的提示词，更有针对性地分析用户上传文件，总结复杂的主题、识别趋势和洞察力，以及改进写作和文档组织的建议，帮助用户提高理解、研究和写作能力。

Gemini 谷歌

收藏打印