職位描述
該職位還未進行加V認證,請仔細了解后再進行投遞!
工作職責:
職位描述
Transformer、大模型算法、AI Agent、Python、C/C 、模型量化、CUDA、NPU推理加速
【工作職責】
1、參與大模型推理系統(tǒng)設計和研究,包括但不限于模型量化、推理加速,進行服務層、推理層和算法層的優(yōu)化探索,實現(xiàn)整體效率提升;
2、進行推理性能分析和優(yōu)化,實現(xiàn)對gpu,npu等異構(gòu)硬件,邊緣、云端等各種場景的高效推理技術(shù);
3、研究實現(xiàn)各種模態(tài)混合的高效大模型推理技術(shù);
4、熟練使用Python、C 、Rust和CUDA編寫代碼;
5、研究和應用Transformer架構(gòu)以及相關領域的最新研究成果,探索應用各種能提升大模型推理效率和精度的高效架構(gòu);
6、研究從推理層面提升模型邏輯能力的各種方法。
任職資格:
崗位要求:
1、計算機科學、軟件工程、人工智能等相關領域,計算機基礎扎實;
2、掌握Python和C 編程語言,具備CUDA編程經(jīng)驗,理解GPU并行計算原理;
3、理解Transformer架構(gòu)相關知識;
4、對深度學習模型的優(yōu)化和高性能計算有濃厚興趣;
5、具備良好的問題解決能力和團隊合作精神;
6、在讀碩士或博士。
薪資:碩士實習生正常6-8K,特別優(yōu)秀者面議,博士面議。
職位描述
Transformer、大模型算法、AI Agent、Python、C/C 、模型量化、CUDA、NPU推理加速
【工作職責】
1、參與大模型推理系統(tǒng)設計和研究,包括但不限于模型量化、推理加速,進行服務層、推理層和算法層的優(yōu)化探索,實現(xiàn)整體效率提升;
2、進行推理性能分析和優(yōu)化,實現(xiàn)對gpu,npu等異構(gòu)硬件,邊緣、云端等各種場景的高效推理技術(shù);
3、研究實現(xiàn)各種模態(tài)混合的高效大模型推理技術(shù);
4、熟練使用Python、C 、Rust和CUDA編寫代碼;
5、研究和應用Transformer架構(gòu)以及相關領域的最新研究成果,探索應用各種能提升大模型推理效率和精度的高效架構(gòu);
6、研究從推理層面提升模型邏輯能力的各種方法。
任職資格:
崗位要求:
1、計算機科學、軟件工程、人工智能等相關領域,計算機基礎扎實;
2、掌握Python和C 編程語言,具備CUDA編程經(jīng)驗,理解GPU并行計算原理;
3、理解Transformer架構(gòu)相關知識;
4、對深度學習模型的優(yōu)化和高性能計算有濃厚興趣;
5、具備良好的問題解決能力和團隊合作精神;
6、在讀碩士或博士。
薪資:碩士實習生正常6-8K,特別優(yōu)秀者面議,博士面議。
工作地點
地址:包頭東河區(qū)新安街道海納百川大廈
查看地
求職提示:用人單位發(fā)布虛假招聘信息,或以任何名義向求職者收取財物(如體檢費、置裝費、押金、服裝費、培訓費、身份證、畢業(yè)證等),均涉嫌違法,請求職者務必提高警惕。
職位發(fā)布者
HR
深圳市億道控股有限公司
- 電子技術(shù)·半導體·集成電路
- 500-999人
- 公司性質(zhì)未知
- 深圳市寶安區(qū)28區(qū)大寶路49-1號金富來大廈