Data Scientist(Creative Vision)
| 想定年収 | ~ 1,800万円程度 ( 25~ 45才 ) |
|---|---|
| 職務内容 |
<ミッション>研究者やエンジニアと協力し、大規模な基盤モデルの学習を支える効率的なデータ基盤およびコードベースを開発していただきます。 <職務内容>データサイエンティストは、データ処理、キュレーション、キャプションを含むデータ関連の業務に従事することが期待されています。 <仕事の魅力>・大規模マルチモーダル生成モデルの学習と開発プロジェクトに携わることができる・研究成果を実世界のアプリケーションに適用し、ビジネスに測定可能なインパクトをもたらすことができる・東京拠点の多様かつ国際色豊かなチームで連携して研究開発ができる・日本国内最大の計算リソースを使った研究開発ができる/【フルリモート可】 |
|
求めるスキル (必要条件) |
・データ基盤/パイプライン:大規模マルチモーダルパイプライン・(ingest→dedupe→filter→shard→snapshot/version)設計・標準化データAPIと高スループットローダー(ストリーミング、キャッシュ、サンプリング等)を提供・キャプション/人手ラベリング:キャプション・注釈フロー構築(属性/関係スキーマ、多言語対応)・ベンダー/内部アノテータ運用、ゴールドセット、IA一致率、QCダッシュボード・自動キャプショナー(CLIP/VLM補助)の検証・キュレーション/品質管理:重複検出、クラスタリング、品質/美的評価、ポリシーフィルタ(NSFW/暴力/PII等)・領域・スタイル・地域間のバランス調整、密キャプションや合成データ効果測定・研究志向データサイエンス:データアブレーション(構成、キャプション密度、合成比)、軽量スコアラー試作(品質/安全)、社内レポート作成・連携/展開:研究・プロダクトと協働しデータ構成をロードマップに沿って最適化・スキーマ/マニフェスト/SLAを整備し、複数チームで再利用可能にする/【英語力不問/大卒以上】 |
| 勤務地 | 東京都 港区 |
企業情報
同社はソフトバンク社の子会社で、日本語に強い大規模言語モデル(LLM)であるSarashinaの開発・運用とそれを社会実装進めています。
ソフトバンク社が所有する計算基盤やデータセンター、データ、研究体制、各事業を行ってる子会社や顧客接点を用いて、生成AIの研究・開発からサービスの提供までを進めています。
※「想定年収」については、当社独自のリサーチによるものでオファー金額をお約束するものではございません。当該企業の採用プロセス時には改めてのご確認をお願いいたします。
同じ職種の求人 この求人を見た人は、こちらも見ています
求人エントリー後の流れ
担当コンサルタントがご入力情報を拝見し、マッチングさせていただきます。
ご本人のご承諾がないまま、企業への推薦に進むようなことはございませんのでご安心ください。
クライス&カンパニーの求人情報は70%が非公開です。
現在、似た条件の非公開求人情報が
1,497件
あります。
ご興味をお持ちの方はこちらからご登録ください。