社名非公開
【課長】サイトリライアビリティエンジニア(SRE)
求人の要約
在宅ワークあり
- 給与
- 年収 930 〜 1,100万円
- 職種
- 通信インフラ設計・構築(キャリア・ISP系)
- 勤務地
- 東京23区
求人詳細
【職務内容】
国内企業で最大規模のAIスーパーコンピューターを開発・運用を共に行って頂くSite Reliability Engineer (Machine Learning Plaftorm) を数名募集します。
スケーラブルかつ洗練されたGPUサーバーを用いた世界有数のAIスパコンを開発・運用し、AIの技術開発に革新をおこしたい方を募集しています。コンピューターアーキテクチャ・ソフトウェアアーキテクチャに精通し、世界に誇れるAIスパコンを共に開発・運用して頂ける方を求めています。
AIスパコンの安定運用を行いながらもAIの進化に合わせ基盤強化を行うには、ソフトウェアの高い開発能力が必要であり、ソフトウェア開発へのこだわりのある方を募集します。
【採用形態・ランク】
・課長レベル
【ポジションのアピールポイント・想定キャリアパス等】
・世界の先端のAIスーパーコンピュータの開発に携わることができ、AIが紡ぎだす未来を自らの手で作れます
・現代のAIの技術開発には高度な分散システムが必要であり、先端のSW/HWに精通できます
・AI/HPC/分散システムのスペシャリストとしてのキャリアパスを想定しています。
#LI-Onsite
#LI-KN
- こんな方を求めています
-
- 経験・スキル
- 【MUST】
下記を全て満たすこと
・ 5年以上のソフトウェア開発・運用の実務経験
・ コンピュータサイエンス/機械学習の修士号、または博士号、または同等の実務経験がある方
・ Kubernetesの利用経験
・ 分散システムの設計・開発経験
・ システムの運用設計・監視の経験
【WANT】
・ 大規模サイトなどでのSREとしての経験(ベアメタルサーバーでの開発経験があれば尚良いです)
・ Kubernetesのクラスタの運用経験
・ 数PB規模の分散ファイルシステムを用いたストレージの開発・運用の実績。
・ GPU関連処理技術への理解(CUDA、NCCL、MPI等)
・ Go言語での開発経験
・ オープンソースプロジェクトへの貢献(GithubのURLがあればプラス)
・ 各種の学習フレームワークへの理解(PyTorch、TensorFlow等)
【求める人物像(ソフトスキル)】
・コンピュータサイエンスに精通し、ソフトウェア開発への情熱のある方
・新しいテクノロジースタック群を追い続けられるだけの強い技術への好奇心を持っている方
・高い自主性を持ち、プロジェクトをともに推進して頂ける方 - 学歴
- 大学卒業以上
- 募集要項
-
- 職種
- 通信インフラ設計・構築(キャリア・ISP系)
- 給与
- 年収 930 〜 1,100万円
- 賞与
- -
- 雇用形態
- 正社員
- 雇用期間
- 期間の定めなし
- 試用期間
- 有り
- 就業時間
- 08:30~17:30
- 休日休暇
- 日曜日,土曜日,祝日
- 諸手当
- 別途面談時にご説明します
- 保険
- 健康保険,厚生年金保険,介護保険,雇用保険,労災保険
- 受動喫煙防止措置
- 敷地内禁煙
- 業種
- 重電・産業用電気機器
※詳細はお仕事のご紹介時にお伝えします
ランスタッドは、すべての⼈に平等に機会が与えられ、その可能性を引き出し、多様な経験と個性を社会の発展につなげていけるようサポートしていきます。