3/1/2014

Mise au format des données

Nous allons mettre en application ces différentes manipulations dans les exercices suivants.
Tout d'abord, créez une base de données ou ouvrez l'une de celles que vous avez créé auparavant.

  1. Données au format PDF : récupérez ce fichier Allocine.pdf contenant la liste des réalisateurs, ouvrez-le et copiez tout le texte, puis collez-le dans un classeur. Que se passe t-il avec Excel ? Avec Calc ?
  2. Données au format texte tabulé : récupérez le fichier Allocine.odt contenant la liste des producteurs, ouvrez-le et copiez tout le texte, puis collez-le dans un classeur. Que remarquez-vous ? Recommencez l'opération en passant par un éditeur de texte en cas de problème.
  3. Essayez la même manipulation avec ce fichier Allocine.doc réalisé avec Word et collez-le dans Excel et dans Calc. Que remarquez-vous et que pouvez-vous en déduire ? Recommencez l'opération en passant par un éditeur de texte en cas de problème.
  4. Données au format texte séparé par des ";" : récupérez ce fichier Allocine.csv contenant la liste des musiciens, ouvrez-le. Il s'ouvre automatiquement dans un tableur ! Ouvrez-le maintenant dans un éditeur de texte. Vous pouvez voir les ";". Revenez dans le tableur et copiez tout le texte, mais ATTENTION, ne sélectionnez que les cellules contenant du texte : si vous sélectionnez les colonnes, vous allez copier/coller entre 65 536 et 1 048 576 lignes, suivant la version du tableur !
  5. Données au format tableur : récupérez ce fichier Allocine_complet.ods, ouvrez-le. Copiez tout le texte de la feuille de calcul Films, en respectant la recommendation du point 4.

Dans le chapitre suivant, nous allons utiliser ce qui vient d'être copié.