系统性能优化

系统扩展性(Scale Out)

  • Numa Aware Qspinlock

    对现有的qspinlock做增强,将锁的等待队列分成两个,本地NUMA节点等待队列和远程NUMA节点等待队列,本地NUMA节点等待队列的线程有限获取锁,减少跨NUMA节点的Cache/总线冲突,从而提升性能

  • MMU gather

    减少TLB flush,从而提升性能

  • 关键驱动如中断控制器 ITS 和 SMMU 的内存分配 NUMA Aware

IO 性能优化

  • 通过优化 IOVA 页表查找和页表释放算法,提升 IO MMU 子系统性能
  • 减少关键结构体的 cache false sharing,从而提升性能

指令加速

  • CRC32 和 checksum 加速

    根据 ARM64 指令以及流水线特点,优化 CRC32 及 checksum 实现,大幅提升数据校验性能。