De l’importance de la déduplication…
sachet_the  Plan fichier

Lorsque nous menons pour nos clients des campagnes d’acquisition clients de plusieurs dizaines ou centaines de milliers d’adresses postales, il est une étape incontournable et encore trop souvent mal connue : la déduplication.

Pourquoi cette étape est primordiale ? Explications :

L’information Fichier.

A l’arrivée de chaque fichier, et quel que soit son format, la succession des champs et la qualité des informations d’adressages saisies, le dédupliqueur se doit d’homogénéiser toutes ces données. Sinon comment comparer, en vue de la déduplication, des informations hétérogènes.

Pour cela, il va falloir réaliser une RNVP – Restructuration, Normalisation et Validation Postale. En clair, restructurer l’adresse selon la norme AFNOR à la fois pour avoir un même référentiel postal pour chacune des adresses, et donc une même disposition de chacun des champs dans chaque fichier, et également s’assurer que les informations vérifiables soient justes. Par exemple une adresse avec pour code postal 75002 et pour ville LILLE sera rejetée car l’association code postal-ville est fausse. De même une adresse au 45 bis rue de Paris à Avignon sera rejetée car il n’y a pas de rue de Paris à Avignon.

Cette étape est importante car elle permet d’éviter les PND – Plis Non Distribuables (nouvelle étiquette de réacheminement généralisée en 2010 par la Poste en remplaçement du courrier NPAI), dont le coût est estimé à environ 150 millions d’euros chaque année. Elle permet également, en fonction du taux de rejet des mauvaises adresses par fichier, de se rendre compte justement de la qualité de chaque fichier commandé.

L’information Légale

J’entends par information légale le fait de repousser de la prospection l’ensemble des adresses de la liste ROBINSON / STOP Publicité. Ce fichier, constitué sous la responsabilité de l’UFMD – l’Union Française du Marketing Direct & Digital –  est déclaratif et permet aux personnes qui ne souhaitent pas être démarchées par voie postale de ne pas l’être. A inclure dans chaque déduplication.

L’information Marketing

Lorsque nous commandons des adresses aux propriétaires de fichiers, nous mentionnons toujours une sélection particulière. Grâce à la déduplication, nous allons savoir si le propriétaire respecte la sélection demandée. Tout d’abord, si nos futurs clients sont des hommes et que nous demandons spécifiquement des hommes, il faut vérifier, dès que le fichier arrive si celui-ci contient bien uniquement des civilités hommes. Sinon, retour à l’envoyeur ! Idem pour les sélections géographiques.

On peut aussi vérifier des tranches d’âge grâce à un « scoring prénom ». Le scoring prénom se base sur les statistiques émises par l’Insee sur la fréquence d’un prénom par rapport à une année de naissance donnée. Ce n’est pas d’une fiabilité absolue mais sur des seniors par exemple, l’âge moyen du fichier ainsi que la répétition des prénoms les plus répandus sur une classe d’âge, nous donne une bonne indication lorsque l’âge réel manque. Enfin, on peut comparer les fichiers reçus avec le ficher Estocade mise en place par La Poste au travers de la Base Nationale des Changements d’Adresses (BNCA).

ESTOCADE® est le fichier des anciennes adresses de particuliers ayant déménagé depuis moins de 5 ans, et dont le contrat de réexpédition de courrier est échu. On recense environ 180 000 contrats de réexpédition souscrits chaque mois. Là encore, on a une bonne idée de la qualité de l’adresse livrée. Plus il y a d’adresses repoussées pour cause de déménagement dans les 5 dernières années, et moins les adresses livrées sont récentes. Or la récence est un facteur prépondérant dans le Marketing Direct.

D’autant plus si on a demandé une sélection d’adresses d’acheteurs 0-12 Mois et qu’on se retrouve avec 5 % ou plus d’adresses repoussées lors du traitement Estocade !

L’information Economique

La première question à se poser est : qu’est-ce que je mets dans mon repoussoir. Quelles sont les personnes qui me connaissent déjà que je ne veux pas prospecter. Toutes les adresses collectées ces 10 dernières années ? Uniquement celles des 24 derniers mois ? Uniquement les clients 0-48 mois ?

La deuxième question à se poser est : quel doit être mon ordre de déduplication ?
Il y a ensuite trois méthodes généralement admises pour donner un ordre de priorité aux fichiers dans les déduplications.

La première consiste à mettre les tests en premier. Vous testez de nouveaux fichiers et vous souhaitez juger de leur efficacité. Vous les mettez dans les premiers fichiers (on dit en tête de dédup) pour que le moins d’adresses possibles soient repoussées de ces fichiers et qu’ils aient ainsi toutes leurs chances.

La deuxième méthode consiste à mettre les tests en dernier. En effet, un test a pour vocation de révéler de nouvelles sources de fichiers et ainsi venir accroître le potentiel des fichiers exploitables pour trouver de nouveaux clients. Or, si ces fichiers sont en tête de dédup et ont de bons résultats, peut-être le sont-ils uniquement parce que nous n’avons pas repoussé de ces fichiers toutes les adresses que nous retrouvons ailleurs sur les autres fichiers entrés en déduplication. Il se peut donc que vous ayez trouvé de nouveaux fichiers qui performent quand ils sont en tête de déduplication, mais pas en fin.

C’est pourquoi il existe une troisième méthode qui consiste à faire tourner aléatoirement une déduplication en ne gardant pour chaque fichier que les adresses uniques, c’est-à-dire qu’on ne retrouve pas ailleurs. Des adresses sans doublon.

Puis on fait un fichier constitué justement de l’ensemble des adresses, quelque soit leur provenance fichier, que l’on retrouve au moins deux fois lors de la déduplication : ce sont les premières de groupe.

Partiront donc en prospection les adresses uniques et premières de groupe, comme pour toute déduplication, sauf que dans ce cas, les premières de groupe sont « sorties » de leur fichier d’origine.

Ainsi les résultats ne se liront que sur des adresses uniques pour chaque fichier. L’ordre de déduplication n’influencera pas les résultats.
Les choix opérés à cette étape sont cruciaux car les implications économiques sont fortes. En effet, mettre trop d’adresses en repoussoir, c’est s‘interdire de « re-recruter » des personnes qui sont entrées au contact de votre entreprise ou association au moins une fois mais à qui vous interdisez de nouveau d’être clients.

De même, on construit son plan fichiers en mettant d’abord les adresses les moins chères, adresses internes, puis les échanges et enfin les locations, car à quoi bon recruter sur des adresses en location réciproque (échange) alors que ces mêmes adresses se retrouvent déjà sur vos internes ou sur les fichiers obtenus en location réciproque.

Enfin, plus la qualité du traitement par le dédupliqueur est grande, plus vos courriers seront distribués, ce qui n’est pas suffisant pour faire une bonne campagne, mais absolument nécessaire !

bulle_commentaires  0 commentaire

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *