Site logo

谷歌(GOOGL.US)更新Gemini API定价 按推理使用分档计费

时间2026-04-03 14:13:05

谷歌A

下载霸财智赢APP,买卖点即市预警,炒家心水交流 >>

智通财经APP获悉,谷歌(GOOGL.US)近日对Gemini API的计费档位进行更新,优化方案与定价均基于实际推理使用需求制定。

本次新增的推理服务档位包括:标准(Standard)、弹性(Flex)、优先(Priority)、批量(Batch)和缓存(Caching)版。

谷歌表示:“Gemini API提供多种优化机制,可根据具体业务负载需求,在运行速度、使用成本与服务稳定性之间实现平衡。无论是搭建实时对话机器人,还是运行大型离线数据处理流程,选择合适的运行模式都能显著降低成本或提升运行效率。”

其中,弹性推理档位通过利用非高峰闲置算力资源,提供标准价格五折优惠,目标延迟为1至15分钟,但不提供延迟保证。批量API档位同样提供标准费率五折优惠,延迟最长可达24小时。

缓存档位计费依据缓存词元(Token)数量与存储时长,推荐用于搭载复杂系统指令的对话机器人、长视频文件重复分析,以及大规模文档集查询等场景。

优先档位定价则比标准价格高出75%至100%,延迟可控制在毫秒至秒级。谷歌建议该档位用于实时客服聊天机器人、实时欺诈检测及业务关键型智能助手等场景。

免责声明:本资讯不构成建议或操作邀约,市场有风险,投资需谨慎!