跳转至

Vllm-ascend推理部署与调优

约 272 个字 预计阅读时间 1 分钟

课程信息

  • 培训日期: 9月25号
  • 培训时间: 10:30-12:00
  • 课程名称: Vllm-ascend推理部署与调优
  • 主要内容: 推理引擎Vllm-ascend大模型部署及调优
  • 关联技术特性: Vllm-ascend

学习目标

  • 了解Vllm-ascend推理引擎的特点和优势
  • 掌握Vllm-ascend的部署和配置方法
  • 学习推理性能优化的策略和技巧

学习笔记

1. Vllm-ascend引擎介绍

2. 部署配置方法

3. 性能优化策略

4. 实际应用案例

技术要点

  • PagedAttention机制
  • 连续批处理
  • 内存管理优化
  • 多GPU推理
  • 动态批处理

优势特点

  • 高吞吐量推理
  • 低延迟响应
  • 内存效率优化
  • 易于部署使用

参考资料

课后练习

  • 完成vLLM-ascend部署
  • 进行性能基准测试
  • 对比不同配置的效果
  • 总结优化经验