知识

加载分类中...

    简介 本自定进度课程从可用性的角度提供了 InfiniBand 技术的基础知识,并建立在 InfiniBand 架构规范的细节之上。它旨在满足安装、配置、管理、故障排除或监控 InfiniBand 结构的任何人的需求。 每个单元之后,都有一个“检查你的知识”测验。在课程结束时,有一个课程完成测验。成功通过测验后,您将获得一份数字结业证书...

    李永鑫     2025-03-14 14:28     來源: Mellanox     0 14 0

    root@tong:/home/tong/ufm-6.15.2-6.ubuntu22.x86_64.mofed5# systemctl status ufm-enterprise.service 。 × ufm-enterprise.service - UFM Enterprise 。      ...

    李永鑫     2025-03-14 14:15     來源: Mellanox     0 12 0

    [图片] 。

    李永鑫     2025-03-14 14:13     來源: Mellanox     0 26 0

    原文链接 https://cloud.tencent.com/developer/article/2361710 。 概述 nccl-test 工具是 nvidia 开源的一项用于测试 NCCL 集合通信的工具。可以用于检测集合通信是否正常、压测集合通信速率。官方开源地址:https://github.com/NVIDIA/nccl-t...

    李永鑫     2025-03-14 14:12     來源: Mellanox     0 10 0

    nv_peer_mem 模块是启用 GPUDirect RDMA 的必需模块,它在 GPU 内存之间提供直接与 Mellanox HCA 设备之间的直接 P2P(对等)数据路径。 这显着降低了 GPU GPU 通信延迟并完全卸载了 CPU, 将其从网络上的所有 GPU GPU 通信中移除。 要获得 GPUDirect RDMA 的良好性...

    李永鑫     2025-03-14 14:09     來源: Mellanox     0 33 0

    Sudoers directory existence                                 [OK] 。 Sudoers directory...

    李永鑫     2025-03-14 14:08     來源: Mellanox     0 11 0

    sudo onie-install -a -i http://abc:123.com@42.62.70.119/cumulus-linux-5.9.1-mlx-amd64.bin && sudo reboot 。 [图片] 。 --------------------------------------------- 。...

    李永鑫     2025-03-14 14:07     來源: Mellanox     0 25 0

    https://www.cnblogs.com/bandaoyu/p/16752175.html 。 。 4.解决办法: 。 需要关闭两个节点上的cpuspeed服务。 [root@storage2 ~]# service cpuspeed stop Disabling ondemand cpu frequency scaling: &...

    李永鑫     2025-03-14 14:04     來源: Mellanox     0 7 0

    [图片] 。 。

    李永鑫     2025-03-14 14:03     來源: Mellanox     0 9 0

    单机模式只需要绑定一个mac,HA模式分别选择主服务器和备服务器的一张以太网卡的mac地址绑定 注意:是以太网卡的mac地址 。 。 [图片] 。 。 。 。 。 。 。

    李永鑫     2025-03-14 13:44     來源: Mellanox     0 20 0
    知识分享平台 -V 5.2.5 -wcp