AdvancedSolver Cluster Changelog
Last modified: December 22, 2024
This page includes updates for AdvancedSolver Cluster. Use this page to keep track of upcoming changes, deprecation notices, new features, and feature updates from AdvancedSolver Cluster.
Dec 22, 2024
安装了 OpenMPI 5.0.6 但不支持 slurm 跨机器的调用. 重命名 MPICH/4.2.0 的 modulefiles 为 MPI/MPICH/4.2.0. 未来将删除 MPICH/4.2.0 这一条.
在 bigMem3 上安装了 AOCL.
Oct 2, 2024
Debug GitLab CI/CD: GitLab 自带的 submodule update
经常会遇到 Access Denied 认证失败, 需要 rerun 的 bug, 索性去掉 submodule, 直接 git clone, 认证方式用 CI_JOB_TOKEN
.
Sep 23, 2024
- 将 slurm 更新到 24.05.
- 新增核时限制.
Sep 10, 2024
更新了用户教程.
June 7, 2024
- 磁盘配额调整
我们对系统磁盘配额进行了调整。具体变更如下:
原配额:quota = 100G,limit = 500G
新配额:quota = 100G,limit = 150G
-
新增登录界面
-
安装 CUDA 工具包和驱动
我们已经安装了最新的 CUDA 工具包和驱动,具体版本如下:
CUDA Toolkit:11.8 和 12.3
CUDA Driver:12.2
June 2, 2024
硬件升级
loginNode 增加内存到 1TB,并增加了新磁盘。
bigMem0 更换了更高速度的内存。
bigMem3 增加内存到 1.5TB。