业务概述

核心托管服务内容
(一)高标准机房环境托管
- 基础设施支持
提供符合 TIER 3 + 标准的数据中心机柜空间,支持 19 英寸标准机架安装
配备冗余电力系统(双路 UPS + 柴油发电机备份),保障 99.99% 电力可用性
采用精密空调系统,维持机房恒温(22±2℃)恒湿(45±5% RH)环境
实施 7×24 小时安保监控(生物识别 + 视频监控 + 门禁系统),确保设备物理安全
- 网络接入服务
提供多运营商冗余网络接入,支持 1Gbps/10Gbps/100Gbps 带宽灵活配置
支持私有网络(VLAN)隔离,实现与客户本地数据中心的专线互联
提供 IP 地址分配、DNS 配置等基础网络服务,保障服务器稳定联网
(二)设备管理与运维支持
- 设备全生命周期管理
提供服务器上架、下架、迁移等物理操作服务
定期进行硬件状态巡检(包括电源、风扇、硬盘、GPU 卡等关键部件)
记录设备资产信息,生成硬件配置清单与状态报告
- 专业运维服务
7×24 小时远程运维支持,包括系统重启、硬件故障诊断
提供操作系统安装、驱动配置、固件升级等基础系统服务
协助客户进行设备故障排查,提供硬件维修建议(维修费用另计)
- 监控与告警
实时监控服务器运行状态(CPU/GPU 负载、内存使用率、磁盘空间)
监测网络流量、电源状态等关键指标,异常情况即时告警
提供可视化监控平台,支持客户远程查看设备运行数据

(三)增值服务与资源对接
- 算力协同调度
支持将托管服务器接入奥飞智算调度平台,实现与云端算力资源的统一管理
提供负载均衡策略,在自有设备与租赁资源间智能分配计算任务
支持弹性扩展,当托管设备负载饱和时自动调度云端算力补充
- 数据与存储服务
可对接奥飞智算分布式存储系统,提供 PB 级弹性存储扩展
支持本地存储与云端存储的数据同步与备份服务
提供数据迁移工具,协助客户完成大规模数据集的导入导出
- AI 生态支持
预装主流深度学习框架(TensorFlow、PyTorch 等)及优化工具
提供模型训练加速方案,适配托管服务器的 GPU 硬件配置
支持接入奥飞智算 AI 开发平台,享受数据集、模型库等生态资源
托管业务优势
降低运营成本:无需自建机房与运维团队,节省场地、电力、人力等成本,综合成本降低 40% 以上
专业环境保障:高标准数据中心环境大幅降低硬件故障率,延长设备使用寿命
灵活弹性扩展:托管设备与云端算力无缝协同,满足业务高峰期算力需求
专注核心业务:将设备管理等事务外包,聚焦算法研发与业务创新
已有硬件设备的企业:拥有 GPU 服务器但缺乏专业机房环境的 AI 企业,通过托管实现设备高效利用
预算有限的科研机构:高校及研究所可将科研用 GPU 服务器托管,节省基础设施投入
混合算力需求客户:需要结合自有设备与租赁算力的企业,实现资源统一调度
多地协同办公场景:跨地域团队可通过托管服务器实现数据与算力的集中共享
服务流程:设备评估→方案制定→合同签订→设备交付→上架部署→运维服务
设备安全承诺:签订设备保管协议,对托管设备的物理安全负责
SLA 保障:承诺 99.99% 的电力与网络可用性,故障响应时间≤30 分钟
数据安全保障:严格遵守数据安全法规,未经授权不触碰客户数据,提供操作日志审计
