2025-03-14 14:28:09 版本 : InfiniBand 课程专业版【by 英伟达学院】
作者: 李永鑫 于 2025年03月14日 发布在分类 / Mellanox 下,并于 2025年03月14日 编辑
 历史版本

备注 修改日期 修改人
创建版本 2025-03-14 14:28:09[当前版本] 李永鑫

简介

本自定进度课程从可用性的角度提供了 InfiniBand 技术的基础知识,并建立在 InfiniBand 架构规范的细节之上。它旨在满足安装、配置、管理、故障排除或监控 InfiniBand 结构的任何人的需求。

每个单元之后,都有一个“检查你的知识”测验。在课程结束时,有一个课程完成测验。成功通过测验后,您将获得一份数字结业证书。
课程时长:5小时

课程内容概览


学习笔记

基本概念和基础操作

infiniband架构层

粘贴图片

粘贴图片

粘贴图片

粘贴图片

粘贴图片

infiniband 数据包流

粘贴图片

粘贴图片

IB驱动信息查询

粘贴图片

检查HCA的类型和版本

粘贴图片

本地IB状态信息查询

粘贴图片

验证二层连通性

粘贴图片

路径追踪

粘贴图片

物理层

监控物理链路的状态

粘贴图片

端口状态

粘贴图片

主机和交换机发现

粘贴图片

数据链路层

粘贴图片

虚拟通道级别

粘贴图片

交换机转发表

粘贴图片

基于信用的流控

粘贴图片

连接信息查询

粘贴图片 粘贴图片

网络层

粘贴图片

识别GID

粘贴图片

链路初始化

交换机转发表

粘贴图片

OPEN SM

主备选举过程

粘贴图片

识别OPEN SM主机

粘贴图片


查询所有的 SM

粘贴图片

IB拓扑

粘贴图片


OPEN SM配置


粘贴图片


配置UPDN 

粘贴图片

粘贴图片 粘贴图片

粘贴图片


粘贴图片

IB 故障排查

节点 上的信息查询

# ofed_info   //ofen_info | more  查询已安装的驱动版本,或查询是否安装了驱动

#lspci         //lspci | grep Mell  查询PCI能否识别到网卡

#ibstat      //ibstatus  查询端口up down 速率  工作协议是IB 还是以太网

# ibportstate (lid)  (端口号)    //ibportstate 1 1  查询某设备或网卡的某个端口的up down 速率 

#ibroue (lid)      // 查询交换机的转发表

#ibv_devices     //查询节点上 网卡的GUID

#ibv_devinfo     //查询节点上 网卡的GUID及更多信息

网络层的信息查询

# ibswitches    //查交换机的GUID和 LID 主机名
# ibhosts    //查主机名和 GUID的对应关系
# ibnodes   //查所有节点的GUID 主机名  "Mellanox Technologies Aggregation Node" 是每台IB交换机自带的
# ibnetdiscover  //站在每台设备的视角 去看自己身连接了哪些设备(gudi 主机名 lid)
# iblinkinfo    //类上  更详细的看端口链路 速率 updow的情况
# sminfo      //open SM工作在哪个 lid上  guid
# ibping   //服务端 ibping --Server  客户端 ibping (LID)
# ibtracert slid dlid   // IB的路径追踪
# ibdiagnet        //ib诊断 最下有日志  后文详细介绍
# ib write lat    //IB的延时测试
# ib read lat
# ib write bw  //IB的带宽测试
# ib read bw

历史版本-目录  [回到顶端]
    知识分享平台 -V 5.2.5 -wcp