"Cuda"
- GPU Compute Backend GPU 加速計算的底層 API 介面(CUDA / ROCm / Vulkan / Metal / SYCL)、決定推論軟體能否用 GPU 跑得快
- 5.3 llama.cpp 在 PC 上 CUDA / ROCm build 取得、核心旗標地圖、llama-bench 校準、多卡 tensor split 的入門設定
- 5.6 GPU 廠商差異 NVIDIA CUDA、AMD ROCm、Intel ARC 在 llama.cpp 生態的相對位置、選卡時的判讀軸