Les formats au cœur de l'informatique : Différence entre versions

De Wiki livre Netizenship
(Mots-clés, gras italique)
(copié-collé de la version 1.1. mai 2016 de l'ODT CDN)
 
(47 révisions intermédiaires par 12 utilisateurs non affichées)
Ligne 1 : Ligne 1 :
formats, logiciel libre
+
'''Notions-clés :''' [https://groups.diigo.com/group/e_culture/content/tag/format ''format''],  
 +
[https://groups.diigo.com/group/e_culture/content/tag/fichier ''fichier''],
 +
[https://groups.diigo.com/group/e_culture/content/tag/%22logiciel+libre%22 ''logiciel libre''],
 +
[https://groups.diigo.com/group/e_culture/content/tag/interop%C3%A9rabilit%C3%A9 ''interopérabilité''],
 +
[https://groups.diigo.com/group/e_culture/content/tag/%22langage+informatique%22 ''langage informatique''].
  
-------
+
'''Profils-clés :''' [https://groups.diigo.com/group/e_culture/content/tag/W3C ''W3C''], [https://groups.diigo.com/group/e_culture/content/tag/ISO ''ISO''], [https://groups.diigo.com/group/e_culture/content/tag/Adobe ''Adobe''], [https://groups.diigo.com/group/e_culture/content/tag/Microsoft ''Microsoft''].
 +
-----
 +
Quel drôle de langage, tout de même, l'informatique... Entre les .doc, .zip, .exe, .avi, on aimerait bien avoir un Champollion<ref>Article [http://fr.wikipedia.org/wiki/Jean-François_Champollion « Jean-François Champollion »], Wikipedia (consulté le 11.01.2016).</ref> des temps modernes à la maison... Essayons d'y voir plus clair.
 +
 +
Lorsqu'on écrit un texte, nous saisissons des informations, c'est-à-dire des données. Ces dernières sont entreposées dans un fichier. Un fichier informatique est donc une collection d'informations numériques réunies sous un même nom, enregistrées sur un support de stockage tel qu'un disque dur, un CD-ROM, et manipulées comme une unité. Le nom du fichier sert à décrire le contenu. Ce nom comporte souvent un suffixe (l'extension) qui renseigne sur la nature des informations et le logiciel à utiliser pour les manipuler. On parle ici de formats de fichiers.
  
__FORCETOC__
+
Le contenu est l'essence du fichier : des textes, des images, de l'audio ou de la vidéo. Pas question d'ouvrir une vidéo avec un logiciel de traitement de texte par exemple. Ce qui nous renseigne immédiatement sur la nature des données (leur format), c'est l'extension (.doc, .odt pour des textes par exemple ; .avi, .Xvid pour de la vidéo). Certaines extensions sont très connues, notamment en vidéo ou traitement de texte, mais il arrive souvent que l'on tombe sur un format de fichier inconnu, ou non reconnu par son ordinateur s'il n'est pas équipé du logiciel capable de l'ouvrir. L'extension renseigne donc sur le moyen d'échanger des données entre divers programmes informatiques ou logiciels.
 +
 +
On appelle interopérabilité cette possible compatibilité des données entre différents logiciels ou systèmes d'exploitation (Windows, Apple, Linux). Il convient cependant de distinguer interopérabilité et compatibilité<ref>[camille.moulin.free.fr/AFUL/interop.html camille moulin]</ref>. La compatibilité est une notion verticale qui fait qu'un outil peut fonctionner dans un environnement donné en respectant toutes les caractéristiques, tandis que l'interopérabilité est une notion transversale qui permet à divers outils de communiquer - quand on sait pourquoi, et comment, ils peuvent fonctionner ensemble.<ref>Voir aussi l'article Fonctions ou produits ?, chapitre 3.</ref>
  
Champolion, en déchiffrant les hiéroglyphes, a relevé un sacré défi ! Il a dû décoder une langue que plus personne ne connaissait afin de pouvoir comprendre tous les textes laissés par les égyptiens... Eh bien, de nos jours, nous avons de nouveaux Champolion qui doivent déchiffrer des langues informatiques utilisées par certains programmes pour sauvegarder les informations de leurs utilisateurs. On parle ici de ''formats de fichiers'', la grammaire et le vocabulaire employés afin de mettre en mémoire les informations sous forme de documents. Ces documents seront réutilisés ensuite par un programme analogue afin de prendre connaissance ou de modifier les informations qu'ils contiennent.
+
== Formats ouverts et formats fermés ==
 +
On distingue un format ouvert dont la spécification (ou le code) est publiquement accessible, d'un format fermé dont la spécification est secrète. Un format fermé correspond généralement à un logiciel donné, seul capable de pleinement l'exploiter.
 +
 +
Une autre distinction s'opère entre un format normalisé, faisant l'objet d'une normalisation par une institution publique ou internationale (ISO, W3C) et un format quelconque, qui peut devenir un standard  s'il est populaire. Un tel format est parfois normalisé par la suite comme OpenDocument<ref> OpenDocument est un format ouvert de données pour les applications bureautiques : traitements de texte, tableurs, présentations, diagrammes, dessins et base de données bureautique.</ref>.
 +
 +
Un format est dit propriétaire s'il a été élaboré par une entreprise, dans un but essentiellement commercial. Un format propriétaire peut être ouvert (le format PDF d'Adobe par exemple) ou fermé (le format .doc de Microsoft par exemple). Mais même lorsque des spécifications sont rendues publiques, les entreprises à l'origine de formats propriétaires tentent d'en conserver le contrôle, soit en proposant régulièrement de nouvelles versions plus élaborées (contrôle par maintien d'une avance technologique), soit en utilisant des moyens juridiques comme le brevet.
 +
 +
Les termes format ouvert, format libre<ref> Le terme format libre est largement utilisé par la communauté du logiciel libre pour désigner par exemple certains formats audio libres comme Ogg Vorbis.</ref> ou encore spécification ouverte, désignent des formats de données interopérables et dont les spécifications techniques sont publiques et sans restriction d’accès ou de mise en œuvre, par opposition à un format fermé ou propriétaire.  
 +
Le problème des formats se pose à chaque fois qu'on veut exploiter l'information numérique produite par un logiciel :
 +
lorsqu'on change la version du même logiciel ;
 +
lorsqu'on passe d'un logiciel à l'autre ;
 +
lorsqu'on échange de l'information entre deux personnes ayant chacune son ordinateur ;
 +
lorsqu'on veut exploiter les données d'un logiciel n'existant plus, voire dont l'éditeur a fermé boutique.
 +
C'est un sujet extrêmement sensible auquel tout utilisateur d'ordinateur est confronté. Si vous avez compris les formats, vous aurez compris un élément essentiel de l’informatique !<ref>Voir aussi l'article Propriétaire, libre et open, chapitre 3</ref>
  
Pourquoi ne pas rendre publics tous les formats utilisés par chaque logiciel ? C'est souvent un moyen employé par les éditeurs de logiciels pour '''garder captifs les utilisateurs de leurs programmes'''. Si vous avez commencé à utiliser le logiciel XYZ de la société ABC, alors ils veulent être sûrs que vous utiliserez exclusivement XYZ dorénavant. C'est paradoxal dans un monde où l'on parle souvent de pluralité, de choix, de liberté, mais c'est un asservissement moderne. On peut également y voir une forme de lutte contre la concurrence car lorsque vos clients sont captifs, la concurrence n'est pas possible, sauf au prix de perdre tout un existant...
+
== « .doc », simple format ou monopole ?  ==
 +
Sous le terme format DOC<ref> Surnommés DOC car ils portent une extension .doc ou .docx.</ref>, on désigne les fichiers qui sont produits par le logiciel Word de Microsoft. C'est certainement le format de fichiers le plus répandu pour travailler sur les documents destinés à l'impression ou à la diffusion (après conversion dans un format adéquat, notamment de type PDF). Son utilisation est fréquemment source de discussions animées car elle pose des questions d'ordre politique, technique et éthique.
  
Les formats tenus secrets sont dits ''fermés'', tandis que ceux qui sont publiés et dont l'usage est autorisé par tous sont dit ''ouverts''. On ne peut pas faire de formats 100% fermés avec des logiciels libres car en étudiant leur mode de fonctionnement, ces logiciels nous révéleraient comment ils conservent les informations dans les fichiers, donc les formats seraient déchiffrés aisément. Par contre, parmi les éditeurs de programmes non libres, certains optent pour des formats fermés, d'autres pour des formats ouverts.
+
*'''Enjeu politique.''' Comme ce format est géré exclusivement par Microsoft, comment faire si l'on décide d'utiliser un autre logiciel que Word pour lire et/ou écrire des documents dans ce format ? Comment s'assurer sur la durée que l'on voudra toujours passer par Microsoft comme acteur incontournable de notre informatique (personnelle ou professionnelle) ? Quid de la mainmise d'une entreprise à but lucratif, et étrangère, sur un domaine aussi critique que la gestion de l'information (numérique) ?
 
+
Le problème des formats se pose à chaque fois qu'on veut exploiter l'information numérique produite par un logiciel :
+
*'''Enjeu technique.''' Les questions techniques relatives au format DOC concernent la sécurité et la pérennité. En matière de sécurité, ne pas être maître des documents produits et émis par son propre ordinateur équivaut à faire une immense confiance à l'éditeur du logiciel qui les gère. De plus, par le passé, des informations confidentielles non désirées ont été retrouvées dans des documents de ce format. Et pour ce qui concerne la pérennité : comment être sûr que les documents produits aujourd'hui seront exploitables par un quelconque logiciel dans dix ans, sachant que les versions successives de Word font constamment évoluer le format de ses fichiers ?
* lorsqu'on change de version du même logiciel
 
* lorsqu'on passe d'un logiciel à l'autre
 
* lorsqu'on échange de l'information entre 2 personnes ayant chacune son ordinateur
 
* lorsqu'on veut exploiter les données d'un logiciel n'existant plus, voire dont l'éditeur a fermé boutique
 
 
 
C'est un sujet extrêmement sensible auquel le moindre utilisateur d'ordinateur a été ou sera confronté.
 
 
 
------------
 
  
Si vous avez compris les formats, vous avez compris une des choses essentielles de l'informatique.
+
*'''Enjeu éthique.''' Envoyer un fichier .doc à ses correspondants place ces derniers dans l'obligation implicite d'utiliser un logiciel spécifique, Word de Microsoft2 en l’occurrence. Cette contraintesemble souvent anodine puisque Word est quasi-omniprésent sur les postes de travail sous Windows. Elle constitue donc un obstacle important pour tous les acteurs du logiciel qui voudraient créer des alternatives. L'environnement bureautique paraît donc actuellement être une chasse gardée de Microsoft.<ref> Il n'y a pas que Word qui gère le format DOC, mais les alternatives produisent parfois des fichiers</ref>
  
 
{| class="wikitable"
 
{| class="wikitable"
! Type de format
+
! Type de format<ref>Article [http://fr.wikipedia.org/wiki/Correspondance_entre_formats_ouverts_et_formats_fermés « Correspondance entre formats ouverts et formats fermés »], Wikipedia (consulté le 07.07.2014).</ref>
! Format libre utilisé par la majorité des éditeurs de logiciel
+
! Format libre utilisé par la majorité des éditeurs de logiciels
! Format privateur
+
! Formats fermés
 
|-
 
|-
 
| Pages web
 
| Pages web
| HTML et ses dérivés (xml, ...)
+
| HTML et ses dérivés(xml, HTML5)  
| Théoriquement aucun, le web étant entièrement ouvert à la base. Cependant, plusieurs greffons (plugins-addons) indispensables dans certains sites ôtent au web son côté ''universel''...
+
| Théoriquement aucun, le web étant entièrement ouvert à la base. Cependant, plusieurs greffons (plugins-addons) indispensables dans certains sites ôtent au web son côté universel...
 
|-
 
|-
| Documents textuels
+
| Traitement de texte
| OpenDocument (.odt)
+
| .odt (OpenDocument)
| Format de Microsoft Word (.doc, .docx)
+
| .doc, .docx (Microsoft Word)
 
|-
 
|-
| Tableur
+
| Tableur (feuille de calcul)
| OpenDocument (.ods)
+
| .ods (OpenDocument )  
 
| Format de Microsoft Excel (.xls, .xlsx)
 
| Format de Microsoft Excel (.xls, .xlsx)
|-
 
| Document textuel
 
| OpenDocument (.odt)
 
| Format de Microsoft Word (.doc, .docx)
 
 
|-
 
|-
 
| Présentation assistée par ordinateur (PréAO)
 
| Présentation assistée par ordinateur (PréAO)
 
| OpenDocument (.odp)
 
| OpenDocument (.odp)
| Format de Microsoft Powerpoint (.ppt, .pptx)
+
| .xls, .xlsx (Microsoft Excel)
 
|-
 
|-
| Image multi-calque
+
| Présentation assistée par ordinateur (PréAO)
| SVG
+
| .odp (OpenDocument )
| PSD
+
| .ppt, .pptx (Microsoft Powerpoint )
|-
 
| Image de qualité photo
 
| PNG
 
| JPG
 
|-
 
| Image vectorielle
 
| SVG
 
| WMF
 
 
|-
 
|-
| Image à couleurs indexées
+
| Image  
| PNG
+
| .png, .jpg, .svg, .gif
| GIF
+
| .psd,  .wmf
 
|-
 
|-
| Sons, musique
+
| Son, musique  
|  
+
| .ogg, .wav
|  
+
| .mp3, .wma, .ram
|-
 
| Vidéo, film
 
| DIVX
 
| AVI, MOV
 
 
|}
 
|}
  
 
+
==Notes et références==
=== Libre, ouvert, privé, fermé : quels termes utilisés ===
 
 
 
Dans le domaine des formats, les termes utilisés sont ''formats ouvert'' et ''formats fermés''. Le sens commun suggère que ouvert serait comme libr,e et fermé comme privateur/propriétaire.
 
 
 
''Ouvert'' signifie en fait que nous pouvons tous accéder à l'information, la modifier, mais qu'il reste une interdiction : la redistribution.
 
 
Ouvert est déjà un bon pas en avant vers la libération des oeuvres. Mais cette limite est considérée comme insuffisante s'il s'agit d'une information fonctionnelle : un mode d'emploi, un format de fichier, un logiciel. Par exemple : je trouve sur le web une recette de gâteau. Je la modifie. Si elle n'est qu'ouverte, j'ai l'interdiction de redistribuer la recette, même si je mentionne la source. Idem avec le format de fichier. Exemple. Un jeune informaticien trouve un bug dans le programme Firefox ; il répare, mais ne peux pas l'intégrer dans le fichier central du logiciel. Car le logiciel, ou le format du fichier, ou le livre, appartient aux éditeurs. Et les éditeurs décident à qui ils donnent quoi... En format uniquement ouvert, pas libre, 'informaticien qui a réparé bénévolement le problème ne pourras pas redistribuer à ses contacts le résultat du travail effectué, car il n'a pas la liberté de redistribuer. 
 
 
 
Libre inclu cette 4e liberté, la redistribution. Mais pas le mouvement OpenSource. C'est pourquoi on utilise plutôt le terme libre si on souhaite aborder la question de l'éthique. Y compris pour les formats. Même si les termes ''libre'' et ''ouvert'' vont dans le même sens, ouvert est partiellement discriminatoire.
 
 
 
Libre, ouvert, des termes proches qui cela peut prêter à confusion. En moyenne, les promoteurs du libre considèrent qu'il est compréhensible de prendre plusieurs années pour comprendre la différence, digérer l'idée, l'intégrer. C'est aussi compliqué que de coordonner ses pieds et ses mains pour conduire une voiture. Il faut des dizaines voir des centaines d'heures concentré à apprendre à faire juste. Pour une conduite citoyenne sans risque sur les autoroute de l'information, il est nécessaire d'être capable de faire la distinction.
 
 
 
 
 
=== Salutation à Francis Muguet.===
 
Chercheur français, Francis Muguet a mené la délégation des promoteurs du libre au sommet de l'ONU sur la société de l'information.
 
En 2001 puis 2003, il a réussi un tour de force politique aux côtés de Richard Stallman, fondateur du mouvement du logiciel libre, au service du bien commun et de l'éthique numérique. Les gouvernements ont signé une déclaration finale en faveur de la culture du Free/Libre, et non pas de l'Open/Ouvert. C'est la reconnaissance de millions d'heures de débats dans les forums sur le web depuis le milieu des années 1990, sur les enjeux de société qui se cachent derrière ces deux termes. Depuis, on peut dire que libre est le terme officiel des citoyens du net et des gouvernements démocratiques. Dans la pratique, Open Source est plus usité, car les journalistes, faiseurs d'opinions, n'ont que trop rarement saisi les enjeux qui se cachent derrière ces termes.
 
Membre du conseil scientifique d'Ynternet.org, Francis Muguet passait parfois dans les bureaux où ces lignes furent écrites.
 
Il s'est éteint en septembre 2010. Ce paragraphe lui rend hommage.
 
 
 
== Annexes ==
 
 
 
=== Liens externes ===
 
* http://fr.wikipedia.org/wiki/Correspondance_entre_formats_ouverts_et_formats_ferm%C3%A9s
 

Version actuelle datée du 15 juillet 2016 à 16:08

Notions-clés : format, fichier, logiciel libre, interopérabilité, langage informatique.

Profils-clés : W3C, ISO, Adobe, Microsoft.


Quel drôle de langage, tout de même, l'informatique... Entre les .doc, .zip, .exe, .avi, on aimerait bien avoir un Champollion[1] des temps modernes à la maison... Essayons d'y voir plus clair.

Lorsqu'on écrit un texte, nous saisissons des informations, c'est-à-dire des données. Ces dernières sont entreposées dans un fichier. Un fichier informatique est donc une collection d'informations numériques réunies sous un même nom, enregistrées sur un support de stockage tel qu'un disque dur, un CD-ROM, et manipulées comme une unité. Le nom du fichier sert à décrire le contenu. Ce nom comporte souvent un suffixe (l'extension) qui renseigne sur la nature des informations et le logiciel à utiliser pour les manipuler. On parle ici de formats de fichiers.

Le contenu est l'essence du fichier : des textes, des images, de l'audio ou de la vidéo. Pas question d'ouvrir une vidéo avec un logiciel de traitement de texte par exemple. Ce qui nous renseigne immédiatement sur la nature des données (leur format), c'est l'extension (.doc, .odt pour des textes par exemple ; .avi, .Xvid pour de la vidéo). Certaines extensions sont très connues, notamment en vidéo ou traitement de texte, mais il arrive souvent que l'on tombe sur un format de fichier inconnu, ou non reconnu par son ordinateur s'il n'est pas équipé du logiciel capable de l'ouvrir. L'extension renseigne donc sur le moyen d'échanger des données entre divers programmes informatiques ou logiciels.

On appelle interopérabilité cette possible compatibilité des données entre différents logiciels ou systèmes d'exploitation (Windows, Apple, Linux). Il convient cependant de distinguer interopérabilité et compatibilité[2]. La compatibilité est une notion verticale qui fait qu'un outil peut fonctionner dans un environnement donné en respectant toutes les caractéristiques, tandis que l'interopérabilité est une notion transversale qui permet à divers outils de communiquer - quand on sait pourquoi, et comment, ils peuvent fonctionner ensemble.[3]

Formats ouverts et formats fermés[modifier]

On distingue un format ouvert dont la spécification (ou le code) est publiquement accessible, d'un format fermé dont la spécification est secrète. Un format fermé correspond généralement à un logiciel donné, seul capable de pleinement l'exploiter.

Une autre distinction s'opère entre un format normalisé, faisant l'objet d'une normalisation par une institution publique ou internationale (ISO, W3C) et un format quelconque, qui peut devenir un standard s'il est populaire. Un tel format est parfois normalisé par la suite comme OpenDocument[4].

Un format est dit propriétaire s'il a été élaboré par une entreprise, dans un but essentiellement commercial. Un format propriétaire peut être ouvert (le format PDF d'Adobe par exemple) ou fermé (le format .doc de Microsoft par exemple). Mais même lorsque des spécifications sont rendues publiques, les entreprises à l'origine de formats propriétaires tentent d'en conserver le contrôle, soit en proposant régulièrement de nouvelles versions plus élaborées (contrôle par maintien d'une avance technologique), soit en utilisant des moyens juridiques comme le brevet.

Les termes format ouvert, format libre[5] ou encore spécification ouverte, désignent des formats de données interopérables et dont les spécifications techniques sont publiques et sans restriction d’accès ou de mise en œuvre, par opposition à un format fermé ou propriétaire. Le problème des formats se pose à chaque fois qu'on veut exploiter l'information numérique produite par un logiciel : lorsqu'on change la version du même logiciel ; lorsqu'on passe d'un logiciel à l'autre ; lorsqu'on échange de l'information entre deux personnes ayant chacune son ordinateur ; lorsqu'on veut exploiter les données d'un logiciel n'existant plus, voire dont l'éditeur a fermé boutique. C'est un sujet extrêmement sensible auquel tout utilisateur d'ordinateur est confronté. Si vous avez compris les formats, vous aurez compris un élément essentiel de l’informatique ![6]

« .doc », simple format ou monopole ?[modifier]

Sous le terme format DOC[7], on désigne les fichiers qui sont produits par le logiciel Word de Microsoft. C'est certainement le format de fichiers le plus répandu pour travailler sur les documents destinés à l'impression ou à la diffusion (après conversion dans un format adéquat, notamment de type PDF). Son utilisation est fréquemment source de discussions animées car elle pose des questions d'ordre politique, technique et éthique.

  • Enjeu politique. Comme ce format est géré exclusivement par Microsoft, comment faire si l'on décide d'utiliser un autre logiciel que Word pour lire et/ou écrire des documents dans ce format ? Comment s'assurer sur la durée que l'on voudra toujours passer par Microsoft comme acteur incontournable de notre informatique (personnelle ou professionnelle) ? Quid de la mainmise d'une entreprise à but lucratif, et étrangère, sur un domaine aussi critique que la gestion de l'information (numérique) ?
  • Enjeu technique. Les questions techniques relatives au format DOC concernent la sécurité et la pérennité. En matière de sécurité, ne pas être maître des documents produits et émis par son propre ordinateur équivaut à faire une immense confiance à l'éditeur du logiciel qui les gère. De plus, par le passé, des informations confidentielles non désirées ont été retrouvées dans des documents de ce format. Et pour ce qui concerne la pérennité : comment être sûr que les documents produits aujourd'hui seront exploitables par un quelconque logiciel dans dix ans, sachant que les versions successives de Word font constamment évoluer le format de ses fichiers ?
  • Enjeu éthique. Envoyer un fichier .doc à ses correspondants place ces derniers dans l'obligation implicite d'utiliser un logiciel spécifique, Word de Microsoft2 en l’occurrence. Cette contraintesemble souvent anodine puisque Word est quasi-omniprésent sur les postes de travail sous Windows. Elle constitue donc un obstacle important pour tous les acteurs du logiciel qui voudraient créer des alternatives. L'environnement bureautique paraît donc actuellement être une chasse gardée de Microsoft.[8]
Type de format[9] Format libre utilisé par la majorité des éditeurs de logiciels Formats fermés
Pages web HTML et ses dérivés(xml, HTML5) Théoriquement aucun, le web étant entièrement ouvert à la base. Cependant, plusieurs greffons (plugins-addons) indispensables dans certains sites ôtent au web son côté universel...
Traitement de texte .odt (OpenDocument) .doc, .docx (Microsoft Word)
Tableur (feuille de calcul) .ods (OpenDocument ) Format de Microsoft Excel (.xls, .xlsx)
Présentation assistée par ordinateur (PréAO) OpenDocument (.odp) .xls, .xlsx (Microsoft Excel)
Présentation assistée par ordinateur (PréAO) .odp (OpenDocument ) .ppt, .pptx (Microsoft Powerpoint )
Image .png, .jpg, .svg, .gif .psd, .wmf
Son, musique .ogg, .wav .mp3, .wma, .ram

Notes et références[modifier]

  1. Article « Jean-François Champollion », Wikipedia (consulté le 11.01.2016).
  2. [camille.moulin.free.fr/AFUL/interop.html camille moulin]
  3. Voir aussi l'article Fonctions ou produits ?, chapitre 3.
  4.  OpenDocument est un format ouvert de données pour les applications bureautiques : traitements de texte, tableurs, présentations, diagrammes, dessins et base de données bureautique.
  5.  Le terme format libre est largement utilisé par la communauté du logiciel libre pour désigner par exemple certains formats audio libres comme Ogg Vorbis.
  6. Voir aussi l'article Propriétaire, libre et open, chapitre 3
  7.  Surnommés DOC car ils portent une extension .doc ou .docx.
  8.  Il n'y a pas que Word qui gère le format DOC, mais les alternatives produisent parfois des fichiers
  9. Article « Correspondance entre formats ouverts et formats fermés », Wikipedia (consulté le 07.07.2014).