Accueil – Le CFO masqué › Forums › Power Query › Suppression incomplète des doublons
Étiqueté : doublons
- Ce sujet contient 8 réponses, 5 participants et a été mis à jour pour la dernière fois par
aline.clozel, le il y a 1 mois et 4 semaines.
-
AuteurMessages
-
11 décembre 2024 à 9 h 02 min #148658
aline.clozel
ParticipantBonjour,
J’ai une table qui possède des doublons que j’essaye de repérer.
Je sélectionner 2 colonnes “nom” et “type” et je fais accueil/réduire les lignes/supprimer les lignes (= Table.Distinct(Source, {“nom”, “type”})).
Pourtant je me trouve quand même à la fin avec des doublons.
J’ai bien nettoyé mes valeurs concernées (transformer nettoyer et supprimer les espaces) et j’ai des lignes en double toujours !
Une idée ?Merci
11 décembre 2024 à 9 h 16 min #148659deltacta
Participantsalut donne un exemple de ton fichier sans donné privé.
cordialement11 décembre 2024 à 10 h 13 min #148660aline.clozel
ParticipantVoici la table dans laquelle je veux supprimer les doublons à partir des colonnes nom_programme et forme_urbaine.
Exemple L’ECRIN DU CARDINAL qui est en 4 fois et qui portant reste dans la liste une fois que j’essaye de supprimer les doublons avec la syntaxe : = Table.Distinct(#”Autres colonnes supprimées”, {“nom_programme”, “forme_urbaine”})Attachments:
You must be logged in to view attached files.11 décembre 2024 à 10 h 42 min #148663Daniel
ParticipantBonjour aline.clozel, le Forum,
Pour répondre à ta demande, la requête suivante supprime les doublons
let
Source = Excel.CurrentWorkbook(){[Name=”Tableau1″]}[Content],
Modif_TypeDonnees = Table.TransformColumnTypes(Source,{{“nom_programme”, type any}, {“forme_urbaine”, type text}, {“millesime”, type any}}),
Supp_DoublonsNomEtForme = Table.Distinct(Modif_TypeDonnees, {“nom_programme”})
in
Supp_DoublonsNomEtFormeMais pas contre dans l’exemple donne L’ECRIN DU CARDINAL, il subsiste encore deux lignes après cette requête
L’ECRIN DU CARDINAL et L’ECRIN DU CARDINAL
C’est comme ça que c’est écrit dans le fichier transmi, l’apostrophe ne me paraît pas être pareil.
Je n’ai pas regardé les autres cas éventuels, mais j’espère que cela vous donnera des pistes de reflexion.
Cordialement
Daniel11 décembre 2024 à 11 h 01 min #148664aline.clozel
ParticipantMerci de votre aide
Je ne vois pas la différence entre votre syntaxe et la mienne à part que j’ai fait ma recherche de doublons sur la base de 2 colonnes ?
-je trouve 84 lignes avec ces 2 colonnes ?
-Avez vous une idée pour trouver la différence entre les 2 écritures ?
-et comment pourrais je rechercher à l’inverse les doublons et en sortir une table à part ?
Beaucoup de question mais de toute façon toute aide me fera avancer.
D’avance, merci11 décembre 2024 à 13 h 47 min #148665eutropejc
ParticipantBonsoir
Peut-être vérifier la présence d’espace insécable dans la base de données.
Bonne soirée11 décembre 2024 à 14 h 35 min #148666ludo.regnier
ParticipantSinon il y a L’attitude Provence avec 2 t et latitude Provence avec un seul t
11 décembre 2024 à 17 h 55 min #148670Daniel
ParticipantBonjour aline.clozel, le Forum,
La requête ci-dessous liste toutes les lignes en doublons
let
Source = Csv.Document(File.Contents(“E:\Téléchargements\doublons_nemarchepas.csv”),[Delimiter=”;”, Columns=3, Encoding=65001, QuoteStyle=QuoteStyle.None]),
Modif_TypeDonnees = Table.TransformColumnTypes(Source,{{“Column1”, type text}, {“Column2”, type text}, {“Column3″, type text}}),
PromotionEntete = Table.PromoteHeaders(Modif_TypeDonnees, [PromoteAllScalars=true]),
RemplacerLesValeurs = Table.ReplaceValue(PromotionEntete,”’”,”‘”,Replacer.ReplaceText,{“nom_programme”}),
GrouperSurNomEtForme = Table.Group(RemplacerLesValeurs, {“nom_programme”, “forme_urbaine”}, {{“Nombre”, each Table.RowCount(_), Int64.Type}}),
FiltrerLignesSupà1 = Table.SelectRows(GrouperSurNomEtForme, each ([Nombre] <> 1))
in
FiltrerLignesSupà1Dans une des lignes du fichier CLOS DU CARDINAL il y a une ligne commençant par L’ et les trois autres par L’ (légère différence d’où l’écriture de la ligne RemplacerLesValeurs = Table.ReplaceValue(PromotionEntete,”’”,”‘”,Replacer.ReplaceText,{“nom_programme”})
Dans cette deuxième requête, nous supprimons les doublons
let
Source = Csv.Document(File.Contents(“E:\Téléchargements\doublons_nemarchepas.csv”),[Delimiter=”;”, Columns=3, Encoding=65001, QuoteStyle=QuoteStyle.None]),
Modif_TypeDonnees = Table.TransformColumnTypes(Source,{{“Column1”, type text}, {“Column2”, type text}, {“Column3″, type text}}),
PromotionEntete = Table.PromoteHeaders(Modif_TypeDonnees, [PromoteAllScalars=true]),
RemplacerLesValeurs = Table.ReplaceValue(PromotionEntete,”’”,”‘”,Replacer.ReplaceText,{“nom_programme”}),
SupprimerLesDoublons = Table.Distinct(RemplacerLesValeurs, {“nom_programme”, “forme_urbaine”})
in
SupprimerLesDoublonsEn espérant avoir répondu à vos questions
Cordialement
DanielAttachments:
You must be logged in to view attached files.13 décembre 2024 à 9 h 03 min #148687aline.clozel
ParticipantMerci beaucoup pour cette aide
-
AuteurMessages
- Vous devez être connecté pour répondre à ce sujet.