1、核心職責聚焦于構建可靠、高效、安全合規(guī)的AI數(shù)據(jù)基礎設施;
2、負責AI模型訓練推理數(shù)據(jù)的全流程管理以及數(shù)據(jù)版本控制及質量評估;
3、設計實現(xiàn)高吞吐、低延遲的數(shù)據(jù)提取、轉換和加載(ETL)流程,以支持模型訓練和評估;使用工具或開發(fā)自動化工具/腳本(如Python)處理大規(guī)模數(shù)據(jù),包括多源數(shù)據(jù)采集、噪聲過濾、去重、缺值補充、存儲、訪問和加載等;
4、設計數(shù)據(jù)存儲架構,包括數(shù)據(jù)庫選型(關系/非關系型、向量數(shù)據(jù)庫/時序數(shù)據(jù)庫)、數(shù)據(jù)表、存儲過程、訪問控制、性能優(yōu)化、冗余備份等;
5、按需實施隱私計算(聯(lián)邦學習/差分隱私)及脫敏策略,確保訓練數(shù)據(jù)符合GDPR/《個保法》要求;
6、按需構建數(shù)據(jù)質量監(jiān)控平臺,定義并自動化校驗數(shù)據(jù)完整性、一致性及分布偏移指標(如PSI)。
任職要求:
1、計算機/統(tǒng)計學相關專業(yè),2年以上數(shù)據(jù)工程經(jīng)驗;
2、精通Python/SQL,熟練使用 PySpark/Pandas 進行大規(guī)模數(shù)據(jù)處理;
3、具有編寫自動化工具、腳本或使用分布式計算工具/ETL工具(如Hadoop、Spark、Talend等)進行數(shù)據(jù)ETL的能力與實際工程經(jīng)驗;
4、具有設計數(shù)據(jù)存儲架構的能力與實際工程經(jīng)驗;
5、熟悉電力、氣象、光伏等領域和設備的數(shù)據(jù)處理、治理經(jīng)驗者優(yōu)先;
6、熟悉GDPR/《個人信息保護法》/隱私計算/脫敏策略者優(yōu)先。
求職提示:用人單位發(fā)布虛假招聘信息,或以任何名義向求職者收取財物(如體檢費、置裝費、押金、服裝費、培訓費、身份證、畢業(yè)證等),均涉嫌違法,請求職者務必提高警惕。

成都
應屆畢業(yè)生
學歷不限
2026-03-05 19:58:44
1054人關注
注:聯(lián)系我時,請說是在四川人才網(wǎng)上看到的。
