Tech · CV Data Engineer

Data Engineer.

Le CV de data engineer doit prouver une chose : tu fais tourner des pipelines fiables en production, pas juste des notebooks scikit-learn. Le lead data filtre sur trois mots : Spark/dbt, Airflow, et cloud warehouse (BigQuery, Snowflake, Redshift). Sans ces trois, ton CV est lu en survol.

Pourquoi ce CV se joue différemment

Le métier a explosé entre 2020 et 2025. Beaucoup de devs back-end se reconvertissent en DE sans connaître les vraies attentes (idempotence, backfill, monitoring de SLA data). Un CV qui montre la maîtrise opérationnelle — pas juste les outils — passe largement au-dessus des candidats outil-buzzword.

Compétences que les recruteurs cherchent

Hard skills

· Python pour data (pandas, PySpark)
· SQL avancé (CTEs, window functions, optim)
· Orchestration (Airflow, Prefect, Dagster)
· Transformation (dbt, SQLMesh)
· Lakehouse (Delta Lake, Iceberg, Hudi)
· Streaming (Kafka, Flink, Spark Streaming)
· Modélisation (Kimball, data vault, OBT)
· Cloud warehouse (BigQuery, Snowflake, Redshift)
· IaC (Terraform, dbt Cloud)
· Monitoring data (Monte Carlo, dbt tests, Soda)

Soft skills

· Pédagogie avec les analysts et DS
· Documentation rigoureuse des schémas
· Rigueur sur l'idempotence et les SLA
· Communication async (PR reviews)
· Curiosité métier (comprendre les KPIs)

Outils

· Airflow / Prefect / Dagster
· dbt Core / dbt Cloud
· Snowflake / BigQuery / Databricks
· Git / GitHub Actions
· Datadog / Monte Carlo

Structure de CV à respecter

01
Titre + stack dominante
« Data Engineer — dbt / Snowflake / Airflow » dit tout en 8 mots. Le lead data sait s'il va plus loin ou pas.
02
Volumes traités
Précise les volumes de tes pipelines : TB/jour, millions de lignes traitées, nombre de DAGs en prod, nombre de tables modélisées. Sans volume, c'est flou.
03
Expériences avec contexte stack
Greenfield (tu as monté la plateforme) vs maintenance (tu as opéré du legacy) = deux signaux différents. Précise lequel.
04
Stack maîtrisée (compact)
Groupé : orchestration, transformation, stockage, streaming, monitoring. 4-6 outils par catégorie max. Ce que tu peux défendre en revue d'architecture.
05
Formation + certifs cloud
École d'ingé / master info en haut si récent. Certifs SnowPro, dbt Analytics Engineer, Databricks Certified, AWS Big Data = vrais signaux.

Bullets : avant / après

Migration legacy → cloud
Faible
J'ai migré des pipelines vers le cloud.
Fort
Pilote la migration ETL Talend on-prem → dbt + Snowflake (180 pipelines, 4 TB/jour) — fraîcheur passée de J-1 à H-2, coûts d'infra -42%, downtime mensuel < 5 min.
Plateforme data greenfield
Faible
J'ai monté une plateforme data.
Fort
Conçoit la plateforme data from scratch (Airflow + dbt + BigQuery + Looker) — 12 sources intégrées en 4 mois, 86 modèles dbt, équipe data (3 analysts) autonome dès le mois 5.
Streaming temps réel
Faible
J'ai mis en place du streaming Kafka.
Fort
Pipeline streaming événements e-commerce (Kafka + Flink + Delta Lake) — 14M événements/jour, latence p99 < 800ms, fraîcheur dashboards business temps réel pour 80 utilisateurs.

Erreurs qui coûtent l'entretien

Lister 12 outils sans architecture
→ Le lead data veut comprendre ton architecture type. Cite 3-4 stacks majeures et explique en 1 ligne le pattern (medallion, hub-and-spoke, etc.).
Confusion avec data analyst ou data scientist
→ Tu construis les pipelines et la plateforme — pas les dashboards finaux ni les modèles ML. Si tu fais les 3, sépare clairement les expériences.
Pas de mention monitoring / SLA
→ Un pipeline non monitoré = pipeline cassé qu'on ignore. Mentionne les outils (Monte Carlo, Soda, dbt tests) et les SLA tenus.
Pas de PR public ou contribution open-source
→ 1-2 contributions à dbt, Airflow, Dagster suffisent à signaler le niveau. Sinon, repo perso avec un mini-pipeline complet.

Fourchettes salariales France

Junior

42–55 K€ brut (Paris) / 36–48 K€ (province)

Confirmé

55–78 K€ brut (3-5 ans, scale-up data-first)

Senior

78–110 K€ brut (senior, lead) — fintechs et big tech 95-140 K€ + RSU

Scale-ups (Doctolib, BlaBlaCar, Aircall, Pigment) : 65-90 K€ mid. Cabinets data (Artefact, Reech, BeOps) : 50-75 K€. Banques / assurances : 50-80 K€, grilles plus rigides.

Mots-clés ATS à intégrer

Les ATS scannent ces termes. Si ton CV n'en contient aucun, il passe sous le radar — même si tu es qualifié.

PythonSQLAirflowdbtSparkKafkaBigQuerySnowflakeDatabricksDelta LakeTerraformETLELTlakehousestreaming

Modèles Vanova recommandés

Pour aller plus loin

Compose ton CV Data Engineer.

L'IA Vanova structure, propose les bons mots-clés ATS, met en page proprement. Dix minutes.

Data Engineer.

Pourquoi ce CV se joue différemment

Compétences que les recruteurs cherchent

Structure de CV à respecter

Titre + stack dominante

Volumes traités

Expériences avec contexte stack

Stack maîtrisée (compact)

Formation + certifs cloud