Dataset : Etonnante réduction de taille

Accueil – Le CFO masqué Forums Power BI Dataset : Etonnante réduction de taille

  • Ce sujet contient 1 réponse, 2 participants et a été mis à jour pour la dernière fois par Sophie Marchand, le il y a 3 années et 8 mois.
2 sujets de 1 à 2 (sur un total de 2)
  • Auteur
    Articles
  • #77236
    Raphaël Lobet
    Participant

    Bonjour,

    J’ai un fichier PBIX contenant deux tables de faits, l’une d’environ 10 millions de lignes et l’autre 50 millions de lignes. Pour une raison qu’il est inutile d’expliquer ici, j’avais ajouté une colonne d’index dans la table à 10 M de lignes. Le fichier pesait 390 mégas et en faisant une analyse de performance j’ai remarqué que cette colonne d’index prenait une place très importante. En effet, après suppression de celle-ci, mon fichier s’est réduit de 140 mégas (35%)! Pourriez-vous m’aider à comprendre comment une colonne avec de simples nombres entiers ait pu occuper autant de place?

    Merci beaucoup

    Raphaël

    #77247
    Sophie Marchand
    Participant

    Bonjour,

    Ce que vous dites est en effet plutôt surprenant mais il est malheureusement difficile de fournir une explication sans avoir accès au fichier.

    Une des raisons possibles, c’est que la compression crée des espèces de listes de valeurs uniques par colonne. Votre colonne d’Index a nécessairement des valeurs différentes sur chaque ligne. Peut-être que vous autres colonnes montrent des valeurs qui se répètent et se compressent donc mieux…

    Sophie

    • Cette réponse a été modifiée le il y a 3 années et 8 mois par Sophie Marchand.
2 sujets de 1 à 2 (sur un total de 2)
  • Vous devez être connecté pour répondre à ce sujet.