Bright Computing Manager (BCM) 是一款面向HPC计算集群的管理平台,可快速启动运行集群,BCM允许用户在裸机上部署完整的集群,并有效地进行管理,为硬件、操作系统、HPC 软件和用户提供统一管理窗口。可为使用者提供清晰的管理界面、简单的使用操作,安全可靠的监控管理、灵活方便的维护方案等,为您的集群提供前所未有的便利。
基础层以常规服务器为基础,兼容主流X86服务器与多种规格基础硬件,支持TCP/IP,InfiniBand 高速网络互联、分布式存储、集中式存储等。
BCM平台层可直接部署在裸机上,快速构建HPC集群管理系统,集成多种资源调度器,实现高速调用资源及细粒度监控管理。
BCM可提供基于Web的集群管理图形用户界面(Bright View)和集群管理Shell(SMSH)。Bright View提供单系统视图,通过“单窗格”管理集群所有内容,管理功能操作简单,所有任务通过直观的可视化界面执行。CMSH通过命令行接口提供与Bright View相同的功能,通过CMSH可在交互模式和批处理模式间切换使用。
BCM允许用户在裸机上部署完整集群,几分钟即可部署完成,并有效管理它们,支持Linux、Red Hat、CentOS等发行版,具备HPC工作负载管理器、Kubernetes、Spark和深度学习库等组件。
BCM集成SLURM 、PBS Professional,Univa Grid Engine,Moad,LSF、OpenLava、Open Grid Scheduler、Maui等多种任务调度器,可实时监控节点的健康状态,Bright 视图界面及用户访问入口为任务调度管理器提供一个友好的用户接口,BCM配置了可靠的任务调度管理器故障转移,可将用户数据识别并将任务调度至云端。
BCM内置多种主流的机器学习库和框架,例如NVIDIA CuDNN,TensorFlow, CUDA,TensorRT,Dynet,Fastai,JupyterHub,NCCL2,MXNet,PyTorch,Chainer,CNTK,Horovod,Keras,CUB,OpenCV3,Protobuf3,Torch, Theano和XGBoost。
从根本上减少了管理GPU所需的时间和精力,并将GPU设备完全集成到整个系统的视图中,拥有完备的GPU管理和监控能力,BCM可直接与NVIDIA的DCGM集成,用户可轻松取得GPU的较大控制权,并获得及时和基于时间的状态监测。同时BCM通过多种方式轻松启用NVIDIA NGC深度学习容器,且增加监控功能,随时查看GPU使用情况。
当集群超出预定的系统极限值时,集群管理会自动采取措施,从而节省时间并防止硬件损坏。用户可在任何项目标准上配置阈值。配置向导将指导用户完成定义规则的步骤:选择标准项目和定义阈值。例如,可建立GPU的极限温度值,系统会自动关闭过热的GPU单元,并向用户的手机发送短信。内置的集群管理命令、Linux命令和脚本都可被预定义。
4U高性能异构计算服务器,采用双路4th Gen Intel® Xeon® Scalable系列处理器,cTDP up to 350W,支持8张双宽GPU...
查看详情4U高性能异构计算开放式液冷服务器,采用了冷板式液冷,搭载双路4th Gen Intel® Xeon® Scalable系列处理器,cTDP up to 350W...
查看详情4U机架式高性能异构计算服务器,双路AMD EPYC™ 9004系列处理器,cTDP up to 400W,支持8张双宽GPU,轻松处理严苛的应用程序...
查看详情