行至云深处,AI在加速!9月13日,2023英特尔®互联网数据中心峰会在武汉盛大开幕。超集信息作为英特尔钛金级合作伙伴受邀出席,携手齐"芯"求突破、促发展、助产业。
本次峰会围绕有望成为新一轮技术革命和产业变革重要驱动力量的大语言模型(LLM)技术展开了重点探讨。从BERT,Transformer到ChatGPT,LLM不断进化,能够处理更复杂的语言结构、语义和上下文信息,实现更加准确和自然的沟通,已成为通往Al时代的核心途径。但LLM的训练及推理量十分庞大,如ChatGPT便拥超过8000亿个单词的数据,已对现有算力基础设施性能提出严峻挑战。
面对大语言模型发展下的算力挑战,超集信息与英特尔通过市场、技术、产品等方面的全方位密切合作,在OCSP设计规范下,基于英特尔®至强®Max系列处理器,联合推出了"LLM推理一体机太阳成集团tyc539",并于本次峰会正式亮相。
超集信息LLM推理一体机
LLM推理一体机基于第四代英特尔®至强®处理器,充分释放Max处理器的HBM高带宽内存性能,结合独有的大模型推理加速引擎,实现推理结果的高准确率、低延迟性,并有效降低总体拥有成本。
HPC+AI无缝切换
一体机搭载两颗第四代英特尔®至强®系列处理器、32根DDR5内存,可提供10个PCIe扩展位,使得一体机既可承载HPC计算任务,又可无缝切换至AI推理业务部署模式,一机两用,确保基础设施成本可控且安全。
高性价比
凭借至强® Max系列处理器更多内核、更先进的I/O与内存子系统以及独特的高带宽内存(HBM)设计,一体机不仅可满足10-60B参数的模型推理能力,在推理准确度、延迟等关键指标均能提供令人满意的结果,综合整体性能与价格,为用户实现极高的性价比。
计算能力灵活扩展
一体机算力可根据用户需求进行定制,同时支持单机的大语言模型推理和多机多柜的分布式大语言模型推理,适应不同模型量级和算力需求的场景。
智能管理与监控
用户可实时监控一体机的资源使用情况和状态,包括设备健康度、设备运行时间、CPU使用数、内存使用率、系统运行负载、进程运行状态、磁盘使用率、磁盘运行状态等。
峰会现场,我们还带来了基于LLM推理一体机的Demo展示。Demo呈现的"文本生成平台"使用国内主流模型ChatGLM-6B,融合英特尔®大模型推理引擎xFasterTrans-former,充分结合至强®Max的英特尔高级矩阵扩展指令集(AMX)和HBM高带宽优势,单颗处理器的文本生成耗时可低至30ms以下。
凭借简单易用的LLM推理一体机太阳成集团tyc539,超集信息将进一步降低模型推理门槛,通过更高带宽、更优性能、更强算力等优势,我们将满足更多客户对高性能、高效率的深度学习推理及训练的需求。