Vvanova

Tech · CV Data Engineer

Data Engineer.

Le CV de data engineer doit prouver une chose : tu fais tourner des pipelines fiables en production, pas juste des notebooks scikit-learn. Le lead data filtre sur trois mots : Spark/dbt, Airflow, et cloud warehouse (BigQuery, Snowflake, Redshift). Sans ces trois, ton CV est lu en survol.

Pourquoi ce CV se joue différemment

Le métier a explosé entre 2020 et 2025. Beaucoup de devs back-end se reconvertissent en DE sans connaître les vraies attentes (idempotence, backfill, monitoring de SLA data). Un CV qui montre la maîtrise opérationnelle — pas juste les outils — passe largement au-dessus des candidats outil-buzzword.

Compétences que les recruteurs cherchent

Hard skills

  • · Python pour data (pandas, PySpark)
  • · SQL avancé (CTEs, window functions, optim)
  • · Orchestration (Airflow, Prefect, Dagster)
  • · Transformation (dbt, SQLMesh)
  • · Lakehouse (Delta Lake, Iceberg, Hudi)
  • · Streaming (Kafka, Flink, Spark Streaming)
  • · Modélisation (Kimball, data vault, OBT)
  • · Cloud warehouse (BigQuery, Snowflake, Redshift)
  • · IaC (Terraform, dbt Cloud)
  • · Monitoring data (Monte Carlo, dbt tests, Soda)

Soft skills

  • · Pédagogie avec les analysts et DS
  • · Documentation rigoureuse des schémas
  • · Rigueur sur l'idempotence et les SLA
  • · Communication async (PR reviews)
  • · Curiosité métier (comprendre les KPIs)

Outils

  • · Airflow / Prefect / Dagster
  • · dbt Core / dbt Cloud
  • · Snowflake / BigQuery / Databricks
  • · Git / GitHub Actions
  • · Datadog / Monte Carlo

Structure de CV à respecter

  1. 01

    Titre + stack dominante

    « Data Engineer — dbt / Snowflake / Airflow » dit tout en 8 mots. Le lead data sait s'il va plus loin ou pas.

  2. 02

    Volumes traités

    Précise les volumes de tes pipelines : TB/jour, millions de lignes traitées, nombre de DAGs en prod, nombre de tables modélisées. Sans volume, c'est flou.

  3. 03

    Expériences avec contexte stack

    Greenfield (tu as monté la plateforme) vs maintenance (tu as opéré du legacy) = deux signaux différents. Précise lequel.

  4. 04

    Stack maîtrisée (compact)

    Groupé : orchestration, transformation, stockage, streaming, monitoring. 4-6 outils par catégorie max. Ce que tu peux défendre en revue d'architecture.

  5. 05

    Formation + certifs cloud

    École d'ingé / master info en haut si récent. Certifs SnowPro, dbt Analytics Engineer, Databricks Certified, AWS Big Data = vrais signaux.

Bullets : avant / après

  • Migration legacy → cloud

    Faible

    J'ai migré des pipelines vers le cloud.

    Fort

    Pilote la migration ETL Talend on-prem → dbt + Snowflake (180 pipelines, 4 TB/jour) — fraîcheur passée de J-1 à H-2, coûts d'infra -42%, downtime mensuel < 5 min.

  • Plateforme data greenfield

    Faible

    J'ai monté une plateforme data.

    Fort

    Conçoit la plateforme data from scratch (Airflow + dbt + BigQuery + Looker) — 12 sources intégrées en 4 mois, 86 modèles dbt, équipe data (3 analysts) autonome dès le mois 5.

  • Streaming temps réel

    Faible

    J'ai mis en place du streaming Kafka.

    Fort

    Pipeline streaming événements e-commerce (Kafka + Flink + Delta Lake) — 14M événements/jour, latence p99 < 800ms, fraîcheur dashboards business temps réel pour 80 utilisateurs.

Erreurs qui coûtent l'entretien

  • Lister 12 outils sans architecture

    Le lead data veut comprendre ton architecture type. Cite 3-4 stacks majeures et explique en 1 ligne le pattern (medallion, hub-and-spoke, etc.).

  • Confusion avec data analyst ou data scientist

    Tu construis les pipelines et la plateforme — pas les dashboards finaux ni les modèles ML. Si tu fais les 3, sépare clairement les expériences.

  • Pas de mention monitoring / SLA

    Un pipeline non monitoré = pipeline cassé qu'on ignore. Mentionne les outils (Monte Carlo, Soda, dbt tests) et les SLA tenus.

  • Pas de PR public ou contribution open-source

    1-2 contributions à dbt, Airflow, Dagster suffisent à signaler le niveau. Sinon, repo perso avec un mini-pipeline complet.

Fourchettes salariales France

Junior

42–55 K€ brut (Paris) / 36–48 K€ (province)

Confirmé

55–78 K€ brut (3-5 ans, scale-up data-first)

Senior

78–110 K€ brut (senior, lead) — fintechs et big tech 95-140 K€ + RSU

Scale-ups (Doctolib, BlaBlaCar, Aircall, Pigment) : 65-90 K€ mid. Cabinets data (Artefact, Reech, BeOps) : 50-75 K€. Banques / assurances : 50-80 K€, grilles plus rigides.

Mots-clés ATS à intégrer

Les ATS scannent ces termes. Si ton CV n'en contient aucun, il passe sous le radar — même si tu es qualifié.

PythonSQLAirflowdbtSparkKafkaBigQuerySnowflakeDatabricksDelta LakeTerraformETLELTlakehousestreaming

Compose ton CV Data Engineer.

L'IA Vanova structure, propose les bons mots-clés ATS, met en page proprement. Dix minutes.