Caractères avec points d’interrogation à modifier

Accueil – Le CFO masqué Forums Power Query Caractères avec points d’interrogation à modifier

  • Ce sujet contient 8 réponses, 3 participants et a été mis à jour pour la dernière fois par magali.careddu, le il y a 1 année et 7 mois.
9 sujets de 1 à 9 (sur un total de 9)
  • Auteur
    Articles
  • #106762
    magali.careddu
    Participant

    Bonjour,
    Lors de l’importation d’un fichier Excel figurant sur un site Sharepoint je récupère dans l’éditeur Power Query, pour la colonne Origine City, des noms de villes avec les caractères suivants (différents des caractères spéciaux habituels) :

    �eske Bud�jovice
    Ji�in
    Mod�ice
    Kn�žnice
    R�ga
    Bac�u
    Kop�ivnice
    Velke Mezi�i�i
    Zub�i
    Hrob�ice
    �i�e�ti
    Ku�im
    T�emošnice
    Praha Zli�in
    �ernin

    Je reprécise qu’il s’agit d’un fichier source au format .xlsx et non au format .csv
    Pensant qu’il s’agit d’un problème d’encodage, je suis allée dans les paramètres de la source (roue dentée) mais je ne peux rien modifier (comme c’est la cas pour les fichiers .csv)

    Est-ce quelqu’un parmi vous a déjà rencontré ce problème et pourrait m’aider à le résoudre ?
    j’ai beau chercher, je ne trouve pas de solution automatique pour le résoudre (à moins d’effectuer les remplacements de noms un par un).

    En vous remerciant d’avance pour l’assistance que vous pourrez m’apporter.

    Cordialement.

    Magali

    #106771
    Daniel
    Participant

    Bonjour Magali, Le Forum,

    Est-ce que le fichier excel reprend aussi les points d’interrogation ? Je pense que cela vient d’un problème d’encodage surtout si la source de ce fichier provient d’un fichier CSV. Est-ce que tu peux vérifier si l’enregistrement sous excel est bien dans le bon format d’encodage (Fichier, Enregistrer sous, Outils, Option Web, Codage là on peut changer le format d’encodage.
    Pas certain que cela règle ton soucis, mais c’est une piste à explorer.
    Cordialement
    Daniel

    #106781
    magali.careddu
    Participant

    Bonjour Daniel,
    Je viens de vérifier et oui le fichier Excel contient déjà les caractères problématiques (avec points d’interrogation).
    Par contre, pour modifier le type de codage j’ai dû suivre un autre chemin que celui que tu as proposé en allant dans le menu Fichier puis Options > Options avancées > Générales puis clic sur bouton “Options web…” puis onglet Codage.
    Malheureusement en choisissant Unicode (UTF-8) ou Latin 9 (ISO), et après avoir remis le fichier enregistré sur le site Sharepoint le problème est toujours là.
    Je joins le fichier Excel source si tu peux éventuellement voir quelque chose à ton niveau.
    Pour rappel, la colonne qui pose problème est la “Origin City” (colonne U). J’ai retiré des lignes pour qu’il fasse moins de 2 MB.
    …et encore merci pour ta réponse !
    Bien cordialement.
    Magali

    Attachments:
    You must be logged in to view attached files.
    #106763
    Stéphane Lorin
    Participant

    Bonjour

    On peut peut-être s’en sortir avec une combinaison de Text.FromBinary et Text.ToBinary.
    le second paramètre de ces fonctions permet de préciser le type d’encodage
    voir
    https://docs.microsoft.com/fr-fr/powerquery-m/textencoding-type
    https://docs.microsoft.com/fr-fr/powerquery-m/text-frombinary
    https://docs.microsoft.com/fr-fr/powerquery-m/text-tobinary

    Pourriez vous joindre un fichier Excel avec quelques noms de cette liste pour faire des tests ?

    Stéphane

    #106842
    magali.careddu
    Participant

    Bonjour Stéphane,

    J’ai envoyé le fichier Excel dans un des posts précédents (voir ma réponse à Daniel). Je vous le renvoie afin que vous regardiez si votre proposition peut fonctionner (voir la pièce jointe).

    Pour rappel, la colonne qui pose problème est la colonne U (Champ “Origin City”), il y a plusieurs villes avec ces fameux caractères spéciaux (points d’interrogation qui apparaissent) que je souhaite traiter. Exemple : Bac�u (le premier nom de ville par ordre alphabétique qui pose problème).

    Encore merci pour votre réponse !
    et à bientôt,
    Magali

    Attachments:
    You must be logged in to view attached files.
    #106844
    Stéphane Lorin
    Participant

    Bonjour
    En ouvrant votre fichier Excel avec un lecteur zip on peut voir le code source (un fichier xlsx est un fichier zip).
    Les chaînes de caractères sont stockées dans sharedStrings.xml
    En ouvrant ce fichier sous un éditeur de texte vous verrez les caractères �
    Ainsi je pense que le fichier lui-même ne contient pas les lettres spécifiques à l’alphabet tchèque.
    Il faudrait revoir la source du fichier

    Stéphane

    #106846
    magali.careddu
    Participant

    Merci Stéphane d’avoir pris le temps d’étudier mon fichier et de m’avoir apporté ces dernières précisions.
    Je compte justement installer vendredi sur mon poste de travail professionnel (via le service informatique) l’éditeur Notepad++ qui serait peut-être une solution pour lire les caractères �.
    Je vous tiens au courant si cela fonctionne.
    Encore merci pour votre recherche.
    Bien cordialement.
    Magali

    #106865
    Daniel
    Participant

    Bonjour Magali, Le Forum,
    Je n’ai malheureusement pas pu trouver une solution/idée pour résoudre ce problème d’accent. Je suis aussi passé par le Notepad++ et j’ai essayé différents types d’encodage (je ne suis pas un expert) sans arriver à retrouver les caractères accentués correctement. Je pense qu’il faudrait regarder comment ont été extraites ces données et voir si on ne peut pas faire quelque chose à ce niveau. D’autres colonnes sont aussi impactées par ce problème (Consignor Name, Consignee Name, Client Name MDM par exemple). Cela se concentre sur trois destinations (Czech, Latvia et Romania mais avec une seule source Rakotrans), si tu reçois un fichier par source, ce serait bien d’investiguer de ce côté pour voir si il est possible de modifier l’import de cette source.
    J’espère que tu auras plus de chances avec le Notepad++ que moi avec lui.
    Cordialement
    Daniel

    #106867
    magali.careddu
    Participant

    Bonjour Daniel,

    Et merci pour ta réponse très complète ! Je vois que tu m’as devancé sur l’idée d’utiliser Notepad ++ 😉 Il n’y a donc pas de solution dans l’immédiat si ce n’est de disposer de la source originale qui pose problème (fichier Rakotrans ?). Malheureusement je ne pourrai pas disposer de ce fichier pour diverses raisons propres à mon entreprise, sachant que le fichier nous a été envoyé avant les vacances…

    En attendant, la collègue qui a traité ce fichier (et que je dois remplacer prochainement) a effectué les remplacements en effectuant des recherches unitaires sous Google, à savoir ville par ville. Elles s’est donc débrouillée comme elle a pu afin d’avancer sur le projet.

    En tous cas, je serai plus vigilante lorsque je devrai à mon tour traiter un nouveau fichier en prenant le temps de bien étudier la qualité des colonnes qui seront à traiter et de poser les questions nécessaires à l’expéditeur de ce fichier.

    Et encore Merci Daniel pour ton aide pédagogique, toujours très efficace sur ce forum 🕵️‍♀️
    Bien cordialement,
    Magali

9 sujets de 1 à 9 (sur un total de 9)
  • Vous devez être connecté pour répondre à ce sujet.