AI操作篇
具身智能技术与应用场景加速对接
优必选Walker S2工业人形机器人量产交付;具身智能钻井机器人集群在极端工况下作业;协作机器人在汽车、3C电子行业应用。
阿里通义Qwen团队推出的SAPO新型强化学习方法
阿里通义推出SAPO这项全称为 Soft Adaptive Policy Optimization(软自适应策略优化) 的新方法,旨在解决大语言模型(LLM)在强化学习训练中的稳定性难题。