Vvanova

Tech · CV Data Scientist

Data Scientist.

Le CV de data scientist est lu par un lead data qui veut deux signaux : la rigueur méthodologique (vraie expérience ML supervisé/non supervisé, pas juste un notebook scikit-learn) et l'impact business (un modèle déployé qui change une décision). Sans ces deux, ton CV reste dans la pile « stagiaire glorifié ».

Pourquoi ce CV se joue différemment

Le marché est plein de profils sortis de bootcamps qui se déclarent data scientist sans avoir jamais mis un modèle en production. La barrière à passer est claire : un repo GitHub avec un projet complet (data → modèle → API → monitoring) vaut plus qu'un master.

Compétences que les recruteurs cherchent

Hard skills

  • · Python (pandas, numpy, scikit-learn)
  • · Deep learning (PyTorch, TensorFlow, Keras)
  • · NLP (Hugging Face, spaCy, LangChain)
  • · Computer vision (OpenCV, Detectron, YOLO)
  • · Statistiques inférentielles et bayésiennes
  • · A/B testing et causalité
  • · Feature engineering avancé
  • · MLOps de base (MLflow, Weights & Biases)
  • · SQL avancé et data wrangling
  • · Cloud ML (SageMaker, Vertex AI, Azure ML)

Soft skills

  • · Cadrage problème business → ML
  • · Communication des résultats à des non-data
  • · Esprit critique sur la qualité des données
  • · Documentation rigoureuse
  • · Curiosité scientifique

Outils

  • · Jupyter / VS Code / Colab
  • · Git / GitHub / DVC
  • · MLflow / Weights & Biases
  • · Airflow / Prefect
  • · BigQuery / Snowflake

Structure de CV à respecter

  1. 01

    Titre + spécialité

    « Data Scientist — NLP / time-series » est 10x plus parlant que « Data Scientist polyvalent ». Le lead data filtre sur les spécialités.

  2. 02

    Lien GitHub + Kaggle en haut

    À côté du téléphone. 2-3 repos avec README sérieux, ou un Kaggle Expert+. Sans portfolio, le lead te skippe.

  3. 03

    Projets ML (3-5 max)

    Pour chaque projet : problème business, dataset, méthode, métriques (accuracy, F1, RMSE), déploiement (oui/non), impact mesuré.

  4. 04

    Expériences avec contexte ML mature ou pas

    Précise si l'équipe data était greenfield (tu as tout monté) ou mature (tu as opéré sur stack existante). Les deux sont valables — pas les mêmes signaux.

  5. 05

    Formation + publications

    Master / PhD en haut si récent. Papers (NeurIPS, ICML, ACL), articles Medium techniques, conférences si pertinent.

Bullets : avant / après

  • Modèle de scoring déployé

    Faible

    J'ai construit un modèle de scoring client.

    Fort

    Conçoit et déploie un modèle de scoring churn (XGBoost, 28 features, AUC 0.84) — campagnes de rétention ciblées, churn mensuel -23% sur 6 mois, ROI 4.2M€/an.

  • NLP recommandation

    Faible

    J'ai travaillé sur un système de recommandation.

    Fort

    Recommandation produits cross-sell e-commerce (embeddings sentence-transformers + reranking) — CTR rec widget +47%, panier moyen +8.4%, en prod sur 2.1M sessions/mois.

  • Computer vision industriel

    Faible

    J'ai utilisé du computer vision pour la qualité.

    Fort

    Détection automatique de défauts ligne de production (YOLOv8 fine-tuné sur 12K images annotées) — précision 96.3%, faux positifs -38% vs contrôle humain, déployé sur 4 sites.

Erreurs qui coûtent l'entretien

  • Pas de modèle en production

    Un modèle qui n'a jamais quitté un notebook compte peu. Cite au moins un déploiement réel (API, batch, embedded). Sinon dis « projet personnel ».

  • Trop d'algos exotiques, pas de baseline

    Un bon DS commence par une baseline simple (régression logistique) et explique pourquoi il passe à plus complexe. Mets cette démarche en avant.

  • Confondre data scientist, ML engineer, data analyst

    Trois métiers, trois CVs différents. Si tu fais surtout des dashboards, tu es data analyst. Si tu mets en prod du ML, tu es ML engineer. Sois honnête.

  • Buzzwords IA générative non maîtrisés

    Ne mets pas « LLM, RAG, fine-tuning, agents » si tu n'as pas un projet derrière. Le lead data détecte ce gonflage en 2 questions.

Fourchettes salariales France

Junior

45–55 K€ brut (Paris) / 38–48 K€ (province)

Confirmé

55–80 K€ brut (3-5 ans, scale-up ou cabinet data)

Senior

80–120 K€ brut (senior, lead) — big tech (Meta, Google, Amazon) jusqu'à 150-180 K€ + stocks

Scale-ups data-first (Mirakl, Doctolib, Qonto, Pigment) : 65-100 K€ mid + RSU. Banque / assurance : 50-80 K€, plus structuré, moins de variable.

Mots-clés ATS à intégrer

Les ATS scannent ces termes. Si ton CV n'en contient aucun, il passe sous le radar — même si tu es qualifié.

Pythonscikit-learnPyTorchTensorFlowpandasSQLmachine learningdeep learningNLPMLOpsMLflowBigQueryAirflowA/B testing

Compose ton CV Data Scientist.

L'IA Vanova structure, propose les bons mots-clés ATS, met en page proprement. Dix minutes.