サイトリライアビリティエンジニア SRE(機械学習プラットフォーム)_DPS
想定年収
応相談
勤務地
神奈川県
リモート
リモート可
掲載中・最終確認 2026/6/1(3日前)
仕事内容
私たちは、NECのAI事業を加速させるためのAIスパコンを開発・運用する、新設のエンジニアリンググループです。世界で最高のモノづくりにこだわり、先進AIで社会にイノベーションを起こしたい方を募集しています。
求めるスキル・経験
必須
5年以上のソフトウェア開発・運用の実務経験
Kubernetesの利用経験及び拡張経験
大規模システムの運用設計・監視の経験
7-10名程度のチームのマネージメント/開発チームのリード経験(課長採用の場合)
歓迎
大規模サイトなどでのSREとしての経験(ベアメタルサーバーでの開発経験があれば尚良いです)
Kubernetesのクラスタの運用経験
数PB規模の分散ファイルシステムを用いたストレージの開発・運用の実績。
GPU関連処理技術への理解(CUDA、NCCL、MPI等)
Go言語での開発経験
オープンソースプロジェクトへの貢献(GithubのURLがあればプラス)