23/12/2013

Des documents textuels (D1.3)

Il y a trois types de formats utilisés lorsqu'on enregistre des textes :

Si seul le contenu compte et que la mise en forme est inutile (par exemple le texte d'un programme informatique), il est habituel d'utiliser un "format texte".

Si la mise ne forme est importante (articles, livres, ...) en général le logiciel que vous utiliserez aura son propre format : docx pour word, odt pour openoffice, ... Ces formats peuvent être incompatibles entre eux : Word ouvre t-il correctement un document odt et réciproquement ?

Entre les deux on trouve le format "texte enrichi"; si vous enregistrez votre document dans ce format, il est probable que tout traitement de texte pourra l'ouvrir correctement.

On désigne par INTEROPÉRABILITÉ la capacité d'un format a âtre utilisable par plusieurs applications.

Les textes sans mise en forme, l'extension TXT

UN FICHIER À CE FORMAT CONTIENT DU TEXTE SANS MISE EN FORME.

Voici un document texte (format texte, extension .txt). Téléchargez-le dans le dossier NOM_PRENOM_TD4 en faisant la même manipulation qu'à l'exercice 1 (clic droit sur le lien puis ...). Si vous cliquez simplement sur le lien, le navigateur ouvre lui-même le fichier lié; un navigateur connait le format texte (c'est le format utilisé pour les pages web : format texte, extension html)

Les documents enrichis

Nous allons maintenant ajouter des enrichissements à TD4-NOM-texte.txt.

Précisions

Le format DOCX correspond à la "norme" OpenXML inventée par Microsoft qui souhaite l'imposer.

Le format RTF est différent du format DOCX (beaucoup d'applications savent l'utiliser). C'est un ancien format propriétaire (microsoft). Les spécifications du format rtf sont publiques. Mais certaines informations (par exemple dans les propriétés du document) ne sont pas enregistrées par ce format.

Le format OpenDocument (par exemple ODT) est un format public utilisé par OpenOffice et LibreOffice; son utilisation est libre. C'est un format ouvert. Ces spécifications sont conformes à la norme OpenDocument favorable aux logicels libres.

Les formats ouverts sont généralement créés dans un but d'interopérabilité : on peut passer avec un document d'une application à une autre.

Exercice

Conclusion : il n'est pas nécessaire de posséder un logiciel "évolué" pour lire un texte au format texte seul. Par contre, l'affichage n'est dans ce cas pas très esthétique. Selon le logiciel utilisé (ou même selon la version utilisée d'un logiciel), l'affichage du texte peut être très différent.

Différents formats pour les documents enrichis

Il existe de nombreux formats permettant d'enregistrer du texte enrichi. Vous connaissez les formats Word (.docx) et .rtf que nous venons de voir et le format OpenOffice/OpenOffice (.odt) que nous avons vu au TD2. Le format .rtf peut être ouvert à la fois par Word et par OpenOffice.

Faites le test (essayez d'ouvrir le document TD4-lettre-motivation.rtf avec OpenOffice).

Essayez maintenant de savoir si OpenOffice sait ouvrir des fichiers au format .docx.

Word sait-il ouvrir les documents au format .odt ? Comment créer un document avec OpenOffice qui pourra être lu par Word ? Réponse

Conclusion : il n'est pas indispensable de posséder l'application Word pour pouvoir ouvrir les documents enregistrés sous le format Doc.

Comparaison de formats de textes

Comparez la taille des fichiers obtenus. Cette situation montre qu'un même texte peut être enregistré sous plusieurs formats ayant des propriétés différentes. Le format .txt ne stocke que les 12 caractères du mot "informatique" (soit 12*1 octet= 12 octets). Les formats .odt et .doc stockent d'autres informations qui ne sont pas affichées dans les documents eux-mêmes. Par exemple : dans Word regardez dans le menu Fichier > Propriétés, le nom de l'auteur du document TD4-NOM-informatique.doc.

Textes et virus (D1.2)

Ce type de formats peut être infecté par ce que l'on appelle un "macrovirus". Une macro est un petit programme lié à un document texte : Menu Outils>Macros...

Ce programme est normalement destiné à automatiser certaines fonctions dans le document; mais on peut le détourner pour lui faire éxécuter d'autres actions extrémement dangereuses et aussi se copier automatiquement d'un document à un autre. Ces programmes se déclenchent à l'ouverture du document.

Vous pouvez paramétrer votre logiciel pour controler l'éxécution des macros: Menu Préférences>Sécurité>...

Exemple : fin 2011 le virus duqu infecte les documents Word (Google : duqu word)

Le format .xls ou .ods

Ce ne sont pas des formats texte. Ils sont liés aux applications Excel ou OpenOffice; ces applications permettent de manipuler des tableaux et surtout d'y programmer des calculs. Néanmoins on peut les utiliser pour faire de simples tableaux. Créez, dans un nouveau document, le tableau suivant :

Enregistrez ce document en le nommant "TD4-NOM-excel.xls" ou "TD4-NOM-excel.ods" dans le dossier NOM_PRENOM_TD4 qui est dans le dossier "etudiant/Documents".

Comme pour les documents textes, OpenOffice peut ouvrir ou enregistrer au format xls.