Home › Forums › Power Query › Suppression incomplète des doublons
Tagged: doublons
- This topic has 8 replies, 5 voices, and was last updated 1 year, 1 month ago by
Aline Clozel.
-
AuthorPosts
-
11 December 2024 at 9 h 02 min #148658
Aline Clozel
ParticipantBonjour,
J’ai une table qui possède des doublons que j’essaye de repérer.
Je sélectionner 2 colonnes “nom” et “type” et je fais accueil/réduire les lignes/supprimer les lignes (= Table.Distinct(Source, {“nom”, “type”})).
Pourtant je me trouve quand même à la fin avec des doublons.
J’ai bien nettoyé mes valeurs concernées (transformer nettoyer et supprimer les espaces) et j’ai des lignes en double toujours !
Une idée ?Merci
11 December 2024 at 9 h 16 min #148659deltacta
Participantsalut donne un exemple de ton fichier sans donné privé.
cordialement11 December 2024 at 10 h 13 min #148660Aline Clozel
ParticipantVoici la table dans laquelle je veux supprimer les doublons à partir des colonnes nom_programme et forme_urbaine.
Exemple L’ECRIN DU CARDINAL qui est en 4 fois et qui portant reste dans la liste une fois que j’essaye de supprimer les doublons avec la syntaxe : = Table.Distinct(#”Autres colonnes supprimées”, {“nom_programme”, “forme_urbaine”})Attachments:
You must be logged in to view attached files.11 December 2024 at 10 h 42 min #148663Daniel
ParticipantBonjour aline.clozel, le Forum,
Pour répondre à ta demande, la requête suivante supprime les doublons
let
Source = Excel.CurrentWorkbook(){[Name=”Tableau1″]}[Content],
Modif_TypeDonnees = Table.TransformColumnTypes(Source,{{“nom_programme”, type any}, {“forme_urbaine”, type text}, {“millesime”, type any}}),
Supp_DoublonsNomEtForme = Table.Distinct(Modif_TypeDonnees, {“nom_programme”})
in
Supp_DoublonsNomEtFormeMais pas contre dans l’exemple donne L’ECRIN DU CARDINAL, il subsiste encore deux lignes après cette requête
L’ECRIN DU CARDINAL et L’ECRIN DU CARDINAL
C’est comme ça que c’est écrit dans le fichier transmi, l’apostrophe ne me paraît pas être pareil.
Je n’ai pas regardé les autres cas éventuels, mais j’espère que cela vous donnera des pistes de reflexion.
Cordialement
Daniel11 December 2024 at 11 h 01 min #148664Aline Clozel
ParticipantMerci de votre aide
Je ne vois pas la différence entre votre syntaxe et la mienne à part que j’ai fait ma recherche de doublons sur la base de 2 colonnes ?
-je trouve 84 lignes avec ces 2 colonnes ?
-Avez vous une idée pour trouver la différence entre les 2 écritures ?
-et comment pourrais je rechercher à l’inverse les doublons et en sortir une table à part ?
Beaucoup de question mais de toute façon toute aide me fera avancer.
D’avance, merci11 December 2024 at 13 h 47 min #148665eutropejc
ParticipantBonsoir
Peut-être vérifier la présence d’espace insécable dans la base de données.
Bonne soirée11 December 2024 at 14 h 35 min #148666ludo.regnier
ParticipantSinon il y a L’attitude Provence avec 2 t et latitude Provence avec un seul t
11 December 2024 at 17 h 55 min #148670Daniel
ParticipantBonjour aline.clozel, le Forum,
La requête ci-dessous liste toutes les lignes en doublons
let
Source = Csv.Document(File.Contents(“E:\Téléchargements\doublons_nemarchepas.csv”),[Delimiter=”;”, Columns=3, Encoding=65001, QuoteStyle=QuoteStyle.None]),
Modif_TypeDonnees = Table.TransformColumnTypes(Source,{{“Column1”, type text}, {“Column2”, type text}, {“Column3″, type text}}),
PromotionEntete = Table.PromoteHeaders(Modif_TypeDonnees, [PromoteAllScalars=true]),
RemplacerLesValeurs = Table.ReplaceValue(PromotionEntete,”’”,”‘”,Replacer.ReplaceText,{“nom_programme”}),
GrouperSurNomEtForme = Table.Group(RemplacerLesValeurs, {“nom_programme”, “forme_urbaine”}, {{“Nombre”, each Table.RowCount(_), Int64.Type}}),
FiltrerLignesSupà1 = Table.SelectRows(GrouperSurNomEtForme, each ([Nombre] <> 1))
in
FiltrerLignesSupà1Dans une des lignes du fichier CLOS DU CARDINAL il y a une ligne commençant par L’ et les trois autres par L’ (légère différence d’où l’écriture de la ligne RemplacerLesValeurs = Table.ReplaceValue(PromotionEntete,”’”,”‘”,Replacer.ReplaceText,{“nom_programme”})
Dans cette deuxième requête, nous supprimons les doublons
let
Source = Csv.Document(File.Contents(“E:\Téléchargements\doublons_nemarchepas.csv”),[Delimiter=”;”, Columns=3, Encoding=65001, QuoteStyle=QuoteStyle.None]),
Modif_TypeDonnees = Table.TransformColumnTypes(Source,{{“Column1”, type text}, {“Column2”, type text}, {“Column3″, type text}}),
PromotionEntete = Table.PromoteHeaders(Modif_TypeDonnees, [PromoteAllScalars=true]),
RemplacerLesValeurs = Table.ReplaceValue(PromotionEntete,”’”,”‘”,Replacer.ReplaceText,{“nom_programme”}),
SupprimerLesDoublons = Table.Distinct(RemplacerLesValeurs, {“nom_programme”, “forme_urbaine”})
in
SupprimerLesDoublonsEn espérant avoir répondu à vos questions
Cordialement
DanielAttachments:
You must be logged in to view attached files.13 December 2024 at 9 h 03 min #148687Aline Clozel
ParticipantMerci beaucoup pour cette aide
-
AuthorPosts
- You must be logged in to reply to this topic.




