Suppression incomplète des doublons

Accueil – Le CFO masqué Forums Power Query Suppression incomplète des doublons

Étiqueté : 

  • Ce sujet contient 8 réponses, 5 participants et a été mis à jour pour la dernière fois par aline.clozel, le il y a 1 mois et 4 semaines.
9 sujets de 1 à 9 (sur un total de 9)
  • Auteur
    Messages
  • #148658
    aline.clozel
    Participant

    Bonjour,

    J’ai une table qui possède des doublons que j’essaye de repérer.
    Je sélectionner 2 colonnes “nom” et “type” et je fais accueil/réduire les lignes/supprimer les lignes (= Table.Distinct(Source, {“nom”, “type”})).
    Pourtant je me trouve quand même à la fin avec des doublons.
    J’ai bien nettoyé mes valeurs concernées (transformer nettoyer et supprimer les espaces) et j’ai des lignes en double toujours !
    Une idée ?

    Merci

    #148659
    deltacta
    Participant

    salut donne un exemple de ton fichier sans donné privé.
    cordialement

    #148660
    aline.clozel
    Participant

    Voici la table dans laquelle je veux supprimer les doublons à partir des colonnes nom_programme et forme_urbaine.
    Exemple L’ECRIN DU CARDINAL qui est en 4 fois et qui portant reste dans la liste une fois que j’essaye de supprimer les doublons avec la syntaxe : = Table.Distinct(#”Autres colonnes supprimées”, {“nom_programme”, “forme_urbaine”})

    Attachments:
    You must be logged in to view attached files.
    #148663
    Daniel
    Participant

    Bonjour aline.clozel, le Forum,

    Pour répondre à ta demande, la requête suivante supprime les doublons

    let
    Source = Excel.CurrentWorkbook(){[Name=”Tableau1″]}[Content],
    Modif_TypeDonnees = Table.TransformColumnTypes(Source,{{“nom_programme”, type any}, {“forme_urbaine”, type text}, {“millesime”, type any}}),
    Supp_DoublonsNomEtForme = Table.Distinct(Modif_TypeDonnees, {“nom_programme”})
    in
    Supp_DoublonsNomEtForme

    Mais pas contre dans l’exemple donne L’ECRIN DU CARDINAL, il subsiste encore deux lignes après cette requête
    L’ECRIN DU CARDINAL et L’ECRIN DU CARDINAL
    C’est comme ça que c’est écrit dans le fichier transmi, l’apostrophe ne me paraît pas être pareil.
    Je n’ai pas regardé les autres cas éventuels, mais j’espère que cela vous donnera des pistes de reflexion.
    Cordialement
    Daniel

    #148664
    aline.clozel
    Participant

    Merci de votre aide
    Je ne vois pas la différence entre votre syntaxe et la mienne à part que j’ai fait ma recherche de doublons sur la base de 2 colonnes ?
    -je trouve 84 lignes avec ces 2 colonnes ?
    -Avez vous une idée pour trouver la différence entre les 2 écritures ?
    -et comment pourrais je rechercher à l’inverse les doublons et en sortir une table à part ?
    Beaucoup de question mais de toute façon toute aide me fera avancer.
    D’avance, merci

    #148665
    eutropejc
    Participant

    Bonsoir

    Peut-être vérifier la présence d’espace insécable dans la base de données.
    Bonne soirée

    #148666
    ludo.regnier
    Participant

    Sinon il y a L’attitude Provence avec 2 t et latitude Provence avec un seul t

    #148670
    Daniel
    Participant

    Bonjour aline.clozel, le Forum,

    La requête ci-dessous liste toutes les lignes en doublons
    let
    Source = Csv.Document(File.Contents(“E:\Téléchargements\doublons_nemarchepas.csv”),[Delimiter=”;”, Columns=3, Encoding=65001, QuoteStyle=QuoteStyle.None]),
    Modif_TypeDonnees = Table.TransformColumnTypes(Source,{{“Column1”, type text}, {“Column2”, type text}, {“Column3″, type text}}),
    PromotionEntete = Table.PromoteHeaders(Modif_TypeDonnees, [PromoteAllScalars=true]),
    RemplacerLesValeurs = Table.ReplaceValue(PromotionEntete,”’”,”‘”,Replacer.ReplaceText,{“nom_programme”}),
    GrouperSurNomEtForme = Table.Group(RemplacerLesValeurs, {“nom_programme”, “forme_urbaine”}, {{“Nombre”, each Table.RowCount(_), Int64.Type}}),
    FiltrerLignesSupà1 = Table.SelectRows(GrouperSurNomEtForme, each ([Nombre] <> 1))
    in
    FiltrerLignesSupà1

    Dans une des lignes du fichier CLOS DU CARDINAL il y a une ligne commençant par L’ et les trois autres par L’ (légère différence d’où l’écriture de la ligne RemplacerLesValeurs = Table.ReplaceValue(PromotionEntete,”’”,”‘”,Replacer.ReplaceText,{“nom_programme”})

    Dans cette deuxième requête, nous supprimons les doublons
    let
    Source = Csv.Document(File.Contents(“E:\Téléchargements\doublons_nemarchepas.csv”),[Delimiter=”;”, Columns=3, Encoding=65001, QuoteStyle=QuoteStyle.None]),
    Modif_TypeDonnees = Table.TransformColumnTypes(Source,{{“Column1”, type text}, {“Column2”, type text}, {“Column3″, type text}}),
    PromotionEntete = Table.PromoteHeaders(Modif_TypeDonnees, [PromoteAllScalars=true]),
    RemplacerLesValeurs = Table.ReplaceValue(PromotionEntete,”’”,”‘”,Replacer.ReplaceText,{“nom_programme”}),
    SupprimerLesDoublons = Table.Distinct(RemplacerLesValeurs, {“nom_programme”, “forme_urbaine”})
    in
    SupprimerLesDoublons

    En espérant avoir répondu à vos questions
    Cordialement
    Daniel

    Attachments:
    You must be logged in to view attached files.
    #148687
    aline.clozel
    Participant

    Merci beaucoup pour cette aide

9 sujets de 1 à 9 (sur un total de 9)
  • Vous devez être connecté pour répondre à ce sujet.