職位描述
該職位還未進行加V認證,請仔細了解后再進行投遞!
Base地:北京望京SOHU或上海閔行莘莊
職責描述:
1. 負責基于強化學習(如Online/Offline RL、Model-based RL)的自動駕駛行為決策與運動規(guī)劃算法研發(fā),重點解決結構化道路(高速、城市快速路)及非結構化場景(自動泊車)中的動態(tài)交互與博弈問題;
2. 針對復雜動態(tài)場景(密集車流、無保護路口、人車混流),設計基于數(shù)據(jù)驅(qū)動的決策規(guī)劃算法,通過大規(guī)模分布式訓練系統(tǒng)提升策略的智能性、安全性及泛化能力;
3. 構建與迭代仿真環(huán)境(如CARLA、NVIDIA Isaac)與世界模型,推動強化學習策略的仿真訓練與實車遷移(Sim2real),形成“真實數(shù)據(jù)→仿真訓練→實車驗證”的閉環(huán)優(yōu)化;
4. 參與全棧自動駕駛決策控制系統(tǒng)的開發(fā),對接感知、預測、端到端模塊,實現(xiàn)基于強化學習的決策規(guī)劃算法在車載平臺上的部署、性能優(yōu)化與實車路測;
5. 跟蹤強化學習在自動駕駛領域的前沿進展(如大模型與RL結合、逆強化學習、多智能體博弈),進行技術預研與算法創(chuàng)新,推動研究成果在量產(chǎn)項目中的應用與落地。
任職要求:
1. 計算機科學、自動化、機器學習、機器人學等相關專業(yè)本科及以上學歷;
2. 具備扎實的強化學習理論基礎,熟悉主流RL算法(PPO、SAC、TD3、IQL等),并至少在一項自動駕駛或機器人項目中具有RL算法落地經(jīng)驗;
3. 熟練掌握Python/C ,熟悉PyTorch等深度學習框架,具備大規(guī)模強化學習分布式訓練(如Ray、Kubernetes)或仿真平臺開發(fā)經(jīng)驗者優(yōu)先;
4. 熟悉自動駕駛決策規(guī)劃常見方法(如MDP/POMDP、搜索與優(yōu)化算法),并能夠?qū)娀瘜W習與傳統(tǒng)規(guī)劃方法(如MPC、Lattice)結合解決實際問題;
5. 具備良好的數(shù)學基礎,熟悉優(yōu)化理論、概率論、車輛動力學建模,能夠支撐RL算法中的獎勵函數(shù)設計、策略優(yōu)化與安全約束處理。
加分項:
1. 在NeurIPS、ICLR、ICML、ICRA、CoRL等會議或期刊發(fā)表過強化學習相關論文;
2. 具備自動駕駛量產(chǎn)項目(如NOA、LCC)或L4級項目(Robotaxi、Robobus)中RL算法集成與調(diào)試經(jīng)驗;
3. 熟悉仿生學習、逆強化學習、世界模型等技術,具備數(shù)據(jù)合成、評測基準構建或RL訓練基礎設施開發(fā)經(jīng)驗;
4. 熟悉ROS、Apollo等自動駕駛框架,或具備CARLA、Isaac Gym等仿真工具鏈的使用和開發(fā)能力。
工作地點
地址:上海閔行區(qū)上海-閔行區(qū)旭輝·莘莊中心-1號樓上海閔行區(qū)旭輝莘莊中心1號樓6層
??
點擊查看地圖
詳細位置,可以參考上方地址信息
求職提示:用人單位發(fā)布虛假招聘信息,或以任何名義向求職者收取財物(如體檢費、置裝費、押金、服裝費、培訓費、身份證、畢業(yè)證等),均涉嫌違法,請求職者務必提高警惕。
職位發(fā)布者
孫先生HR
上海鈞正網(wǎng)絡科技有限公司
-
互聯(lián)網(wǎng)·電子商務
-
1000人以上
-
私營·民營企業(yè)
-
鼓樓街道
相似職位
-
德邦快遞招聘配送員 6000-10000元應屆畢業(yè)生 不限德邦快遞
-
二手車鑒定評估師 7000元以上應屆畢業(yè)生 不限上海中智項目外包咨詢服務有限公司
-
花都社區(qū)高凈值客戶服務經(jīng)理/15K /周末雙休 10000-15000元3年以上 大專中國平安人壽保險股份有限公司廣東分公司
-
實驗室質(zhì)量負責人 6000-8000元5年以上 本科寧夏國測檢驗檢測有限公司
-
營銷管理崗(豐都)(J51433) 6元以上2年以上 本科中國人壽保險股份有限公司重慶市分公司
-
化工項目施工安全員崗 7000-14000元應屆畢業(yè)生 大專中國化學工程第十四建設有限公司

應屆畢業(yè)生
本科
2026-03-05 23:34:33
364人關注
注:聯(lián)系我時,請說是在寧夏人才網(wǎng)上看到的。
