ServMAX® C208-X3
2U机架式高性能计算服务器,采用双路3rd Gen Intel® Xeon® Scalable系列处理器,支持PCIe4.0协议,16条DDR4插槽,整机...
查看详情PlatforMax智算融合平台是超集信息自主研发的面向于高性能计算(HPC)和人工智能(AI)场景的智算融合平台,采用先进的技术架构,由同一个管理节点纳管,可以将计算节点资源划分为HPC和AI两个分区,分区资源既相互独立又相互融合,满足用户在不同时间段对于HPC及AI业务的不同资源需求,为用户提供了一套既可以进行HPC作业,又可以进行AI训练的环境,助力HPC+AI业务的发展。
基础设施以硬件服务器为载体,支持主流 X86 服务器,配置 NVIDIA GPU 实现高性能加速计算,采用主流分布式存储设备,支持 TCP/IP,InfiniBand 高速网络互联。
平台层是整个系统的核心内容,采用先进的技术架构,能够实现异构资源的高效管理、调度和监控,除提供AI模型开发、AI模型训练到AI部署的完整功能外,也适用于生命科学、气象预报、量子力学、油气勘探等HPC科学计算领域。
提供集群资源监控、集群节点管理、集群分区管理、用户权限管理、数据存储、任务镜像等管理服务,对集群内资源进行HPC分区节点、AI分区节点的管理,采用表盘式工作界面,太阳成集团tyc7111cc看到已申请配额,已用资源、用户资源、所有节点信息、任务统计等,菜单界面平滑直观,功能化繁为简,一目了然。
管理员对用户和用户组的CPU、GPU、内存和存储配额进行设定,限定资源数量。系统具备集群管理员、分区管理员、项目管理员、普通用户多级多角色管理,用户的数据存储空间相互隔离,每个用户只能访问各自空间的数据,无法越界访问未授权的数据,支持设置用户有效期,以及批量导入用户。
平台内置Tensorflow、PyTorch、MxNet、CUDA、Gromacs、NAMD、LAMPPS、OpenVINO、oneAPI等镜像,还可连接NGC、Docker HUB等获取镜像,允许用户通过Docker Exec连接并配置镜像环境;支持通过requirements.txt、pip、conda等多种方式安装配置python包,满足不同背景和层次的用户对镜像制作的要求。
平台通过NFS实现统一的网络文件存储系统,支持基于GlusterFS和NFS的多个卷同时共存和使用,支持数据上传、下载、删除、压缩、解压、复制、移动和内容浏览等,NFS数据支持本地数据缓存,提高IO性能。不同用户的私有数据相互隔离,用户不同的项目数据之间相互隔离。
用户可在平台上提交AI或HPC任务,AI任务可选单机或分布式任务,单机最小支持1/8GPU,分布式任务支持容器之间SR-IOV高速虚拟网卡通信,同时具备超参数调节、模型可视化、日志查看等一系列环节和工具;HPC任务支持Web、Shell、命令行等方式提交任务,Slurm调度器根据资源需求,调度任务到最优节点,保障任务高效运行。
监控系统CPU、GPU、内存使用率,节点状态,分区资源消耗和任务运行情况,通过单一界面管理平台,从分区、用户、集群、任务类型等各个层次和维度展示当前GPU的空闲和占用状态,支持按种类查看GPU卡的使用,监控报表可选择AI或HPC生成所选时间的监控表报。
2U机架式高性能计算服务器,采用双路3rd Gen Intel® Xeon® Scalable系列处理器,支持PCIe4.0协议,16条DDR4插槽,整机...
查看详情4U机架式高性能GPU服务器,搭配双路3rd Gen Intel® Xeon® Scalable系列处理器,支持PCIe 4.0协议,搭载10张GPU,提供超高算力...
查看详情6U机架式高性能GPU服务器,搭配双路AMD EPYC™ 7003/7002系列处理器,支持PCIe 4.0协议,搭载8片A800 40/80GB SXM4...
查看详情4U机架式服务器,双路第三代英特尔®至强®可扩展系列处理器,单颗最高可达40核,支持CPU TDP 270W,16根DDR4 DIMM内存插槽,整机...
查看详情