10. 如何配置作业失败重试时内存自动扩充比例?

XLearning1.1版本中支持作业失败重试,并且重试后作业worker与ps所申请的内存会自动扩充。用户可通过调整配置项来进行自定义:

  • xlearning.app.max.attempts
  • xlearning.worker.mem.autoscale
  • xlearning.ps.mem.autoscale注意:作业失败重试时,客户端报出的AM连接失败信息可忽略。