据谷歌介绍,Gemini Pro 是其功能最强大的模型之一,可用于处理广泛的文本和图像推理任务。Gemini Pro 运行于谷歌数据中心,可通过 Gemini API 访问。谷歌表示,使用 Gemini 最简便的方法是通过 Google AI Studio 进行操作,这是一个基于 Web 的工具,可在浏览器中进行原型设计和运行 prompt(提示词)。如果对结果满意,开发人员就可以将模型导出为代码,并使用其所选的编程语言(例如 Python)在后端运行。
对于 Android 应用,谷歌提供了 Google AI client SDK for Android,它将 Gemini REST API 封装为 Kotlin 原生的 API。借助它,开发人员无需直接与 REST API 交互,也不需要在 Android 应用中实现用于访问 Gemini 模型的服务器端服务。
除了纯文本模型之外,Gemini 还提供了一个多模态模型(gemini-pro-vision),能够从文本和图像输入生成文本,并支持流式处理,从而实现更快的交互。
为了进一步简化开发人员的工作流程,最新的 Android Studio 预览版引入了一个新的项目模板,该模板将指导开发人员使用 Gemini Pro 所需的步骤。
据了解,除了 Gemini Pro 之外,谷歌还提供了一个更小的模型 Gemini Nano,该模型可以在设备端运行,数据可以不离开设备,并且即使在网络不可用时也能使用。Gemini Nano 可在部分设备上通过 AICore 使用,AICore 是 Android 14 中的一个新系统服务,旨在简化将 AI 集成到 Android 应用中,其负责模型管理、运行时(runtime)、安全性等多个方面。