Les formats au cœur de l'informatique

De Wiki livre Netizenship

formats, logiciel libre, format ouvert, format fermé


Quel drôle de langage, tout de même, l'informatique... Entre les .doc, .zip, .exe, .avi, on aimerait bien avoir un Champollion des temps modernes à la maison... Essayons d'y voir plus clair.

Lorsqu'on écrit un texte, nous saisissons des informations, soit des données. Ces dernières sont entreposées dans un fichier. Un fichier informatique est donc une collection d'informations numériques réunies sous un même nom, enregistrées sur un support de stockage tel qu'un disque dur, un CD-ROM, et manipulées comme une unité. Le nom du fichier sert à décrire le contenu. Ce nom comporte souvent un suffixe (l´extension) qui renseigne sur la nature des informations et le logiciel à utiliser pour les manipuler. On parle ici de formats de fichiers.

Le contenu est l'essence du fichier : des textes, des images, de l'audio ou de la vidéo. Pas question d'ouvrir une vidéo avec un logiciel de traitement de texte par exemple. Ce qui nous renseigne immédiatement sur la nature des données (leur format), c'est bien l'extension (.doc, .odt pour des textes par exemple; .avi, .Xvid pour de la vidéo). Certaines extensions sont très connues, notamment en vidéo ou traitement de texte, mais il arrive souvent que l'on tombe sur un format de fichier inconnu, ou non reconnu par son ordinateur s'il n'est pas équipé du logiciel capable de l'ouvrir. L'extension renseigne donc sur la manière d'échanger des données entre divers programmes informatiques ou logiciels.

On appelle interopérabilité cette possible compatibilité des données entre différents logiciels ou systèmes d'exploitation (Windows, Apple, Linux). Il convient cependant de distinguer « interopérabilité » et « compatibilité ». Pour être simple, on peut dire que la compatibilité est une notion verticale qui fait qu'un outil peut fonctionner dans un environnement donné en respectant toutes les caractéristiques et l'interopérabilité est une notion transversale qui permet à divers outils de pouvoir communiquer - quand on sait pourquoi, et comment, ils peuvent fonctionner ensemble.

Formats ouverts et formats fermés

On distingue un format ouvert dont la spécification est publiquement accessible, d'un format fermé dont la spécification est secrète. Un format fermé correspond généralement à un logiciel seul capable de pleinement l'exploiter. Une autre distinction s'opère entre un format normalisé, faisant l'objet d'une normalisation par une institution publique ou internationale (ISO, W3C) et un format quelconque, qui peut devenir un standard de fait s'il est populaire. Un tel format est parfois normalisé par la suite comme OpenDocument[1]. Un format est dit propriétaire s'il a été élaboré par une entreprise, dans un but essentiellement commercial. Un format propriétaire peut être ouvert (le format PDF d'Adobe par exemple) s'il est publié, ou fermé (le format '.doc' de Microsoft par exemple). Mais même lorsque des spécifications sont rendues publiques, les entreprises à l'origine de formats propriétaires tentent d'en conserver le contrôle à la fois soit en proposant régulièrement de nouvelles versions plus élaborées (contrôle par maintien d'une avance technologique) soit en utilisant des moyens juridiques comme le brevet.

Les termes format ouvert, format libre[2] ou encore spécification ouverte, désignent des formats de données interopérables et dont les spécifications techniques sont publiques et sans restriction d’accès ni de mise en œuvre, par opposition à un format fermé ou propriétaire.

Le problème des formats se pose à chaque fois qu'on veut exploiter l'information numérique produite par un logiciel :

  • Lorsqu'on change la version du même logiciel ;
  • Lorsqu'on passe d'un logiciel à l'autre ;
  • Lorsqu'on échange de l'information entre deux personnes ayant chacune son ordinateur ;
  • Lorsqu'on veut exploiter les données d'un logiciel n'existant plus, voire dont l'éditeur a fermé boutique.

C'est un sujet extrêmement sensible auquel tout utilisateur d'ordinateur a été ou sera confronté.

Si vous avez compris les formats, vous avez compris une des choses essentielles de l'informatique.


Type de format Format libre utilisé par la majorité des éditeurs de logiciel Format privé/propriétaire/exclusif
Pages web HTML et ses dérivés (xml, ...) Théoriquement aucun, le web étant entièrement ouvert à la base. Cependant, plusieurs greffons (plugins-addons) indispensables dans certains sites ôtent au web son côté universel...
Document textuel OpenDocument (.odt) Format de Microsoft Word (.doc, .docx)
Tableur OpenDocument (.ods) Format de Microsoft Excel (.xls, .xlsx)
Présentation assistée par ordinateur (PréAO) OpenDocument (.odp) Format de Microsoft Powerpoint (.ppt, .pptx)
Image PNG, SVG, GIF PSD, JPG, WMF
Son, musique Ogg FLAC, Ogg Vorbis, Ogg Speex ALAC, WMA, MP3
Vidéo, film WebM, Ogg Theora, Xvid AVI, MOV, DivX

Salutation à Francis Muguet

Chercheur français, Francis Muguet a mené la délégation des promoteurs du libre au sommet de l'ONU sur la société de l'information. En 2001, puis 2003, il a réussi un tour de force politique aux côtés de Richard Stallman, fondateur du mouvement du logiciel libre, au service du bien commun et de l'éthique numérique. Les gouvernements ont signé une déclaration finale en faveur de la culture du Free/Libre, et non pas de l'Open/Ouvert. C'est la reconnaissance de millions d'heures de débats dans les forums sur l'Internet depuis le milieu des années 1990 sur les enjeux de société qui se cachent derrière ces deux termes. Depuis, on peut dire que libre est le terme officiel des citoyens du Net et des gouvernements démocratiques. Dans la pratique, Open Source est plus usité, car les journalistes, faiseurs d'opinions, n'ont que trop rarement saisi les enjeux qui se cachent derrière ces termes. Membre du conseil scientifique d'Ynternet.org, Francis Muguet passait parfois dans les bureaux où ces lignes furent écrites. Il s'est éteint en septembre 2010. Ce paragraphe lui rend hommage.


Notes

  1. OpenDocument est un format ouvert de données pour les applications bureautiques : traitements de texte, tableurs, présentations, diagrammes, dessins et base de données bureautique.
  2. Le terme « format libre » est largement utilisé par la communauté du logiciel libre pour désigner par exemple certains formats audio libres comme Ogg Vorbis

En savoir plus