谷歌Gemini API新层级:机遇与挑战并存

张开发
2026/4/6 21:18:02 15 分钟阅读

分享文章

谷歌Gemini API新层级:机遇与挑战并存
谷歌为Gemini API添加Flex和Priority层级可根据工作负载分配任务。同时发布Gemma 4。新层级虽简化开发工作但也引发受监管行业担忧对企业AI战略有重要意义。新层级助力开发者谷歌为Gemini API新增Flex Inference和Priority Inference层级开发者能通过单一接口按工作负载关键程度分配任务。这解决了企业从简单AI聊天机器人转向复杂工作流时的问题简化了智能系统开发者的工作。低成本与高可用性特点Flex Inference定价为标准费率50%可靠性低、延迟高适用于后台任务能让企业以低成本运行后台AI工作负载。Priority Inference能获最高处理优先级溢出请求会自动路由到标准层级适用于2级和3级付费项目。引发受监管行业担忧Greyhound Research首席分析师Sanchit Vir Gogia指出降级机制让受监管行业担忧不同系统条件下相同请求可能有不同结果引发公平性、可解释性和可审计性问题。对企业AI战略的意义新层级是行业向分层推理定价转变的一部分反映AI基础设施受限。首席信息官和采购团队需明确合同中的服务层级、降级条件等建立成本控制和可审计性机制。编辑观点谷歌Gemini API新层级为开发者带来便利降低成本但也存在不确定性。企业在利用新层级时需谨慎应对确保服务质量和合规性未来分层推理定价需更完善。

更多文章