近日,全球权威市场研究机构 IDC 发布《AI 原生云/新型云厂商重构 Agentic 基础设施》报告,深度剖析生成式 AI(GenAI)爆发背景下,AI 基础设施市场的变革趋势与核心玩家价值。报告明确指出,“AI 原生云厂商凭借稳定的供应链、显著的价格优势及专业化能力,已在 AI 基础设施市场站稳脚跟”,并将 GMI Cloud 与 CoreWeave 列为新型 AI 原生云厂商中的重点调研推荐对象,从技术实力、生态资源、产品布局及战略视野四大维度,肯定其在推动企业 GenAI 落地中的核心作用。

IDC 洞察 AI 应用市场焦点:AI 原生云成 GenAI 跨越“PoC 到生产”关键,推理与合规需求凸显
IDC 在报告中强调,当前亚太地区企业 GenAI 采用率呈爆发式增长——65%的亚太企业将在 2025 年实现超 50 个 GenAI 场景投产,26%的企业甚至计划部署超 100 个场景。但企业在从概念验证(PoC)向规模化生产迈进时,面临三大核心挑战:高性能推理基础设施短缺、数据主权合规压力、多云环境下资源调度效率低。
随着大模型预训练逐渐收敛,IDC 在报告中明确预判:“2025 年起,AI 基础设施市场焦点将全面转向推理侧”,而推理场景对 “高吞吐、大并发、成本可控” 的需求,正倒逼厂商突破传统技术架构。报告数据显示,2025 年亚太地区使用 AI 推理基础设施的组织占比已达 84%,但超过 24% 的企业仍受 “基础设施成本过高” 困扰,如何在 “性能” 与 “成本” 间找到平衡点,成为行业核心挑战。
对此,IDC 明确提出解决方案方向:“企业应优先选择地域邻近、供应链稳定的专用 AI 基础设施,寻找具备 GPU 加速能力、支持混合云部署且符合区域合规要求的 AI 原生云合作伙伴”。而这一判断,恰好与 GMI Cloud 的核心战略高度契合,也成为报告重点关注并推荐 GMI Cloud 的关键依据。
同时,GMI Cloud 自研双引擎突破性能瓶颈,匹配 IDC“推理效率优先”趋势。针对 IDC 强调的“2025 年 AI 基础设施焦点转向推理侧,需满足高吞吐、大并发与成本平衡”需求,GMI Cloud 自研 Cluster Engine 与 Inference Engine 双引擎,形成技术壁垒:
- Cluster Engine(IaaS 层):提供灵活弹性的资源调度能力,支持长期预留与按需使用结合的模式,同时支持定制化私有云服务、K8s 集群管理、InfiniBand 虚拟化组网,确保企业数据安全与资源效率最大化,契合 IDC“模块化、可定制计算服务”的推荐标准;
- Inference Engine(MaaS 层):集成全球近百个前沿大语言模型、语音及视频生成模型,通过对开源模型的深度优化,实现 API 调用延时缩短、Token 吞吐效率提升,同时提供差异化定价的 on demand 模型部署托管服务,帮助企业平衡“性能需求与成本控制”,直接响应 IDC“需优化 AI 项目总拥有成本(TCO)”的建议。同时,作为面对 AI 推理场景的核心引擎,其具备高并发、低延迟及动态弹性扩缩容能力,能够精准匹配全球范围内企业对推理基础设施“弹性适配业务波动”的核心诉求。