近日,繼10月9日宣布與全球智能產品ODM頭部企業龍旗科技達成深度戰略合作后,智元機器人再次公布一項重大技術突破:其研發的真機強化學習技術,已在與龍旗科技合作的驗證產線中成功落地,為消費電子等精密制造領域帶來“即插即用”的智能升級方案。
據了解,智元此次落地的真機強化學習方案,實現的突破主要在于:機器人可在真實產線中自主學習、持續優化作業策略,新技能訓練與穩定部署僅需數十分鐘,且性能全程不降級。在換線、換型或流線調整時,該系統只需最小的硬件改動和標準化部署流程,即可顯著提升柔性、壓縮部署時間與成本,破解“產線剛性與產能波動”的行業痛點。
長期以來,精密制造產線面臨剛性瓶頸,傳統機械臂依賴復雜夾具設計與場地改造,調試周期長、換型成本高;“視覺+力控”等柔性方案雖有改進,卻存在參數敏感、部署復雜等問題,難以適配消費電子行業高頻產品迭代需求。
相較傳統方案,該真機強化學習方案具備三大核心優勢。一是極速部署,訓練周期從“數周”銳減至“數十分鐘”,效率實現指數級提升;二是超高適配,自主克服來料位置偏差、尺寸公差等擾動,在長周期運行中持續保持工業級穩定性與100%任務完成率;三是柔性換型,任務變更僅需快速再訓練,無需定制夾具或復雜工裝,即可適配不同產品與工序,破解消費電子行業長期存在的“產線剛性與產能波動”難題。
智元機器人表示,真機強化學習方案在占用空間、硬件依賴與環境適配方面展現出高度通用性,可在不同工位和產品線上快速遷移與復用。
機器人在十分鐘內學會新技能,這一進步背后的技術突破如何?11月3日,智元機器人合伙人兼首席科學家羅劍嵐在接受證券時報等媒體采訪時表示,機器人實現十分鐘學會新技能,主要是通過預訓練模型,結合少量示范和糾錯,快速點亮策略,并在工業給定范圍內微調參數來達成的。
“在工業產線上,能把技術做到50%和做到100%,是完全不同的兩件事,智元目前是首個真正將真機強化學習應用在產線上的廠商,這一突破點主要在于性能,在于真正能將AI模型部署在工廠中,實現百分之百的準確率。”羅劍嵐指出。
據羅劍嵐介紹,與傳統的仿真強化學習相比,真機強化學習的核心突破在于直接將學習閉環嵌入產線。“不需要解一個近似目標,而是直接優化最關心的指標,把通過率、節拍、良率這些變成訓練時的第一性目標,而不是像傳統方法那樣去解一個近似目標。真機強化學習使用的是產線原生信號進行判定和獎勵,這樣就無需解決仿真與現實的差距問題,傳統強化學習大多在仿真環境中進行,而我們直接在真實產線中解決這個問題。”
從落地場景來看,智元真機強化學習方案在龍旗科技產線中落地,主要用于上下料這類傳統自動化難以完成、需要柔性換線的任務。上下料指的是在工廠中將料品在不同工序間轉移、放置的過程,羅劍嵐指出,目前整個工業中未被自動化或難以自動化的環節,約80%都集中在上下料,這類任務的主要難點在于工序間的不確定性、有限范圍內的變化,以及對精度的要求。
“龍旗內部有很多工序,我們之所以選擇上下料這個工序作為起點,是因為它具有代表性,許多工序抽象出來都有共性。比如我們在龍旗科技FCT測試站上看到的iPad放置工序,就是一個要求非常精密、輕柔、穩妥,不能有任何損壞的高精度工序。”羅劍嵐進一步解釋稱。
羅劍嵐強調,真機強化學習方案在產線工序上落地,相當于在工序上不斷鍛煉機器和大腦。每個工序、產線或機臺都存在微小差異,比如料盤放置等都有隨機性,但其也有共性,智元的做法是最大限度地將共性部分提取和共享,對差異化部分則通過真機強化學習進行優化,最終達到工廠要求的百分百成功率、接近人的節拍數,以及極致的魯棒性(指系統在面對不確定性、變化和干擾時,能夠維持其性能和穩定性的能力)。
此次智元機器人真機強化學習落地工業產線,或為具身智能工業化開啟新紀元。智元機器人表示,智元與龍旗科技雙方將基于本次成果持續推進技術迭代,推動真機強化學習在消費電子、汽車電子等更多精密制造場景的應用與復制,加速構建具身智能驅動的 AI 制造生態,助力工業智能化的普及化與標準化進程。