摘要:为系统评估国产AI芯片在大模型微调任务中的实际性能,本研究基于LLaMA-Factory框架与LoRA方法,在DeepSeek-R1-Distill-Qwen-7B模型上对比了华为昇腾910B2X与NVIDIA RTX 4090的性能表现。实验严格控制批量大小与(试读)...