智元称其研发实机强化进修手艺已落地工业产线

发布时间:2025-11-10 16:09

  实机强化进修(Real-World Reinforcement Learning)手艺是指,让AI算法间接正在实正在物理设备长进行强化进修(RL)锻炼的手艺。简单来说,它让机械人不只正在虚拟仿实里学会策略,而是间接正在实机上通过试错进修最优行为。国外多项学术研究显示,强化进修正在工业机械人中的应器具有庞大潜力,但从仿实到实机再到工业规模的不变摆设仍面对较多挑和,正在机械人研究范畴,目前更多的是逗留正在研究阶段,并未大规模工业产线使用。据领会,这项实机强化进修手艺,可让机械人正在实正在产线中自从进修、持续优化功课策略,新技术锻炼取不变摆设仅需数十分钟,正在换线、换型或流线调整时,该系统只需最小的硬件改动和尺度化摆设流程,即可显著提拔柔性、压缩摆设时间取成本。智元机械人合股人、首席科学家罗剑岚告诉磅礴科技(),目前这套方案已进入常态化功课形态,最大的冲破点正在于其机能实正将AI模子摆设正在工场中,正在联调机制下,落地工业产线的毛病率曾经被节制正在产线验收范畴内。罗剑岚称,工业产线较为保守,保守从动化设备正在具有不确定性的场景下,难以同时兼顾高精度、高成功率和通用性,而实机强化进修手艺能更好地处理这一问题。线%将使用于集中上下料取柔性换线环节。持久以来,细密制制产线面对刚性瓶颈。保守机械臂依赖复杂夹具设想取场地,调试周期长、换型成本高;“视觉+力控”等柔性方案虽有改良,却存正在参数、摆设复杂等问题,相较于保守方案,实机强化进修手艺具备三大焦点劣势:极速摆设、超高适配和柔性换型,可正在分歧工位和产物线上快速迁徙取复用。其锻炼周期从“数周”缩短至“数十分钟”,效率实现指数级提拔;自从降服来料误差、尺寸公役等扰动,正在长周期运转中持续连结工业级不变性取100%使命完成率。不外,相较于仿实进修,实机强化进修手艺或面对成本昂扬等问题。正在成本节制方面,罗剑岚暗示,实机强化进修手艺的劣势表现正在两方面:显性成本方面间接取产能挂钩,提拔了出产效率;现性成本方面,具有高模块化、正在分歧工序间切换很是便利,只需极小程度的硬件调整。罗剑岚强调,“跟着经验的堆集,这一系统正在新产线上摆设会更快,成本也会越来越低。”他暗示,这是一套可办理、可复制、可拓展的东西,将来会将其打形成通用模板进行推广,像搭乐高积木一样,从3C逐渐扩展到汽车、医疗等范畴。