告别算力焦虑:硅基流动“弹性 GPU”公测上线

张开发
2026/4/21 6:12:37 15 分钟阅读

分享文章

告别算力焦虑:硅基流动“弹性 GPU”公测上线
过去两年我们通过 MaaS 落地了“Token 工厂”构想帮助开发者与企业客户加速 AI 应用落地。我们的公有云 MaaS 已服务近 1,000 万用户及 10,000 家企业客户日均生成数千亿 Token私有化 MaaS 在能源、金融、互联网等多个行业落地让客户无需深入算力运维的复杂细节高效推进智能化转型。这一切背后依托于硅基流动灵活、便捷、可靠的算力调度能力。今天这份经过超大规模生产级环境检验的强大底层能力以独立服务对外开放。我们推出“弹性 GPU”服务满足用户自主、高效部署任意模型及各类计算密集型服务的进阶需求。弹性 GPU 服务不是简单的算力租赁而是 AI 云原生、极致弹性与企业级高可用的新一代算力调度引擎。它支持多元异构芯片与主流推理框架可一键部署、极速启动提供高可用稳定运行让你从繁重的资源管理中解放以更高效、更高性价比的方式将 AI 推理服务部署于云端享受“黑灯工厂”般的自动化算力体验。定义新一代算力调度四大核心能力解读弹性 GPU 的核心能力及价值主要体现在以下方面弹性真正的 Serverless GPU闲时资源归零动态响应峰谷让每一分钱都花在刀刃上。公有云 MaaS 每天在百余款模型之间发生上万次扩缩容这套经过实战检验的自动动态算力调度能力完全开放。它可快速扩容以承载瞬时并发在闲时则可将资源智能释放至“零”彻底消除闲置成本。我们提供按需、抢占、预留多种计费模式让你无需再为不可预测的流量预付大量成本也无需因资源不足而错失业务机遇。兼容屏蔽芯片差异异构算力极致性价比抹平算力差异聚焦业务创新本身。无论你使用 NVIDIA、华为昇腾、沐曦还是摩尔线程等芯片均可获得一致、高效的部署体验。结合硅基流动自研推理加速引擎针对 LLM、ComfyUI 工作流进行深度优化显著缩短生成耗时。你可以像我们的公有云 MaaS 一样用高性价比算力做预处理用高性能算力做推理输出在多元算力环境中将异构集群的性价比压榨到极致。高效开箱即用交付生产级推理端点生产级部署缩短到“分钟”。基于与公有云 MaaS 同源的推理加速技术我们提供的 GPU 云函数模板让用户一键部署平台已有的百款模型即可获得与 Serverless API 一致的使用体验包括支持 PD 分离、多机并行等高级特性。无论是基于硅基流动自研推理框架还是 vLLM、SGLang 等开源框架的模型服务亦或是复杂 ComfyUI 工作流均可实现“快捷自定义部署分钟级上线”。你获得的不再是基础资源而是一个开箱即用、稳定可靠的生产级推理服务端点。稳健企业级高可用支持纳管自有算力为严苛场景而生支持混合云统一管控。通过多区域、多集群部署保障服务高可用与负载均衡凭借多层次安全隔离满足金融、政务等场景的严苛合规要求可自动敏捷故障探测与智能异常处理。同时支持纳管自有算力构建私有弹性集群实现混合云环境的统一调度与全局管理。深入核心生产环节三大场景解决方案基于以上能力弹性 GPU 服务已能深入支撑以下各类生产场景典型应用包括专属实例对服务连续性与稳定性要求极高的场景提供专属、稳定的计算实例同时保持按需自动扩缩容能力在保障体验的同时实现降本增效。私有化模型部署可快速部署语言、图片、语音等自有模型高效完成从模型部署到可调用 API 服务的完整实验流程大幅缩短模型研发到验证的周期。模型部署后支持对企业内部提供服务也可上架到硅基流动公有云 MaaS享受百万级流量曝光。ComfyUI 工作流托管支持把任意 ComfyUI 工作流部署为 API 服务。以 AI 创作平台 BizyAir 为例。该平台融合多种 AI 模型与工作流为用户提供“开箱即用”的 AI 设计体验。此前BizyAir 主要依赖手工维护的 K8S 集群和共享存储方案主要面临部署繁琐、管理混乱、稳定性不足、运维负担重、成本不经济等挑战。引入硅基流动“弹性 GPU”完成系统改造后BizyAir 实现系统更稳、运维更轻、成本更省、协作更顺。目前BizyAir 平台已服务数万名用户其近 1 万个工作流及数千个 AI 应用均稳定运行在硅基流动“弹性 GPU”服务之上。3 步开启高效推理“弹性 GPU”服务公测开启。只需 3 步即可完成从资源准备到推理服务调用的全过程1. 申请开通功能开通后在控制台可访问“GPU 云函数”和“镜像仓库”2. 创建并部署云函数选择合适的“组织模板”或“公共模板”并配置 GPU 资源完成部署你也可以推送私有镜像部署任意服务3. 调用服务部署完成后获取“公网 API 端点”通过 HTTP 请求调用。即刻开启你的高效推理之旅https://siliconflow.cn/serverless-gpu注本次公测优先面向企业认证的组织账户开放。若当前为个人账户建议先创建组织并完成企业认证后再申请公测。

更多文章