Création de contenu structuré

Découvrez en quoi consiste la création de contenu structuré et de quelle manière les règles pour la création de contenu structuré sont définies dans Adobe FrameMaker.

Dans ce sujet

Introduction

Dans un flux de production de création de contenu non structuré, il est possible de créer des documents basés sur une narration relativement libre. Par exemple, il est possible d’avoir des intitulés suivis de paragraphes ou des graphiques avec des légendes. Dans le cas de la création de contenu structuré, les règles de contenu respectent une structure cohérente qui s’applique à toutes les informations de même type. Vous pouvez par exemple décider d’appliquer les règles de contenu suivantes :

La définition de ces règles de contenu se fait soit dans une définition de type de document (DTD) soit dans un schéma XML. Une vérification automatique de la conformité du contenu s’effectue suivant les règles énoncées dans la DTD ou le schéma XML.

Prenons par exemple la structure d’une adresse. Les règles de contenu exigent que les adresses contiennent un nom d’employé, un numéro de rue, un nom de rue, un nom de ville et un code postal. Dans le cas d’une création de contenu non structuré, seule une correction ou une révision permet de détecter une adresse sans numéro de rue. Avec la création de contenu structuré, une vérification automatique permet de confirmer que la structure est bien complète et conforme. Cela permet de garantir une organisation cohérente du contenu.

Avantages

Organisation cohérente des informations

Vous pouvez créer une application structurée pour vous assurer qu’une liste à puces contient au moins deux éléments ou qu’une image inclut une légende.

Validation automatique de l’organisation des informations

FrameMaker fournit des repères visuels pour indiquer lorsque la structure du document est rompue.

Figure 1. Ici, l’élément titre est absent de la rubrique DITA
Repères visuels pour indiquer que la structure d’un document est rompue

Cohérence du contenu

Imposer une structure garantit une cohérence améliorée du contenu dans plusieurs documents d’un ensemble de documents.

Prise en charge de la réutilisation du contenu

FrameMaker fournit des fonctionnalités de réutilisation du contenu basées sur l’interface utilisateur comme DITAVAL, Filtrer par attribut ou les tableaux de relations, pour permettre aux utilisateurs de réutiliser facilement le contenu ultérieurement.

Prise en charge des métadonnées pour ajouter des informations aux documents

Outre le contenu tel que le texte et les images, vous pouvez également associer des métadonnées à un document structuré, par exemple, l’auteur d’un document. Vous pouvez aussi utiliser des attributs pour associer des métadonnées à des éléments spécifiques dans un document. La fonction Filtrer par attribut dans FrameMaker vous permet de définir des valeurs d’attribut, puis de filtrer le contenu d’un document structuré en fonction de ces attributs.

Séparation du contenu et du formatage

Les auteurs se concentrent sur le contenu. Le flux de publication contrôle le formatage et l’aspect de la sortie finale. Par exemple, la sortie imprimée peut utiliser une police différente de celle en ligne.

Toutefois, FrameMaker prend en charge le formatage dans les applications structurées. Cela implique que l’environnement de création de contenu structuré de FrameMaker affiche le contenu formaté. Il fournit des repères visuels aux utilisateurs sur le formatage du document.

Figure 2. Vue XML
Vue XML du contenu formaté

Figure 3. Vue WYSIWYG
Vue WYSIWYG du contenu formaté

Réduction des efforts de localisation

Dans la mesure où les documents structurés séparent le contenu du formatage, l’utilisation des technologies de localisation réduit considérablement les efforts et les coûts de localisation.

SGML, XML et XHTML

A l’aide de FrameMaker, vous pouvez importer et exporter des documents structurés au format SGML ou XML (y compris XHTML 1.0). Une fois importé, le fichier structuré ne constitue plus un fichier SGML ou XML, mais un document FrameMaker structuré. Pour revenir au format d’origine, enregistrez le fichier au format SGML ou XML.

SGML

Le langage SGML (Standard Generalized Markup Language) est la norme internationale de tous les langages de balisage pour l’échange et le stockage des données.

Le SGML est un langage de balisage descriptif plutôt que procédural. En d’autres termes, différents systèmes peuvent traiter le même document. Chaque système applique des instructions de traitement différentes aux sections concernées.

Le SGML est le premier langage à avoir eu recours aux DTD (Document Type Definition), qui définissent de façon formelle le document par ses composants et sa structure. Les documents du même type peuvent dès lors être vérifiés et traités de façon uniforme.

Un document qui est conforme à la structure d’une DTD est considéré comme valide.

XML

Le langage XML (Extensible Markup Language) est un format généralisé de représentation d’informations structurées, principalement destiné au Web. Comme les formats HTML et SGML, XML exige l’utilisation d’éléments et d’une structure.

Cependant, le XML diffère du langage HTML dans la mesure où il est extensible. Vous pouvez ainsi définir non seulement vos éléments, mais aussi leur ordre, leurs relations, ainsi que leur mode de traitement et d’affichage.

Le XML vous permet de définir et d’appliquer une structure adaptée à votre contenu. Un document XML qui est conforme à la structure d’une DTD est considéré comme valide. Un document XML qui utilise des éléments conformes aux spécifications XML standard est considéré comme correctement formé.

XHTML 1.0

Le langage XHTML (Extensible Hypertext Markup Language) est une extension du langage HTML basée sur XML et conçue pour fonctionner avec des applications de type XML. Il peut être visualisé, édité et validé avec les outils XML standard. L’emploi du langage XHTML est une solution simple pour migrer de HTML vers XML tout en conservant une compatibilité ascendante et descendante.

XML et XHTML 1.0

Le XML constitue une base pour la création de contenu structuré et se différencie ainsi des outils de traitement de texte et de publication assistée par ordinateur basés sur le style et orientés sur les paragraphes. Le XML organise le contenu en une arborescence hiérarchique d’éléments.

Dans les environnements de traitement de texte (tels que FrameMaker non structuré), la relation entre les différents éléments du document est mise en évidence par le formatage. Le fichier documentaire, en revanche, ne saisit pas ces relations, étant donné qu’un document créé par traitement de texte est composé d’une chaîne de paragraphes. Par exemple, FrameMaker non structuré ne détecte pas la subordination d’un style paragraphe courant au style Entête1 qui le précède. La création de documents structurés, pour sa part, saisit les relations hiérarchiques entre les différents éléments d’un document.

DITA et DocBook

DITA et DocBook sont des applications structurées prêtes à l’emploi pour la documentation technique dans Adobe FrameMaker.

DITA

DITA (Darwin Information Typing Architecture) est un modèle de données XML pour la rédaction et la publication. Il s’agit d’une norme ouverte qui est définie et mise à jour par le comité technique DITA du consortium OASIS. DITA fournit un ensemble d’éléments et d’attributs, ainsi qu’une structure prédéfinie, conçus spécifiquement pour la documentation technique.

DITA 1.3 comprend cinq types spécialisés de rubrique :

  • Tâche

  • Concept

  • Référence

  • Entrée de glossaire

  • Résolution des problèmes

Parmi les éléments typiques de DITA, on trouve par exemple <title>, <shortdesc>, <prolog>, <body>, <p>, <fig>, <image>, <table> et <related-links>.

Vous trouverez ci-dessous certaines des fonctions spécifiques à DITA :

  • DITA est axée sur les rubriques. Chaque rubrique peut correspondre à du contenu qui peut être réutilisé dans différents contextes.

  • DITA peut comporter plusieurs architectures d’informations, car DITA sépare le contenu du contexte. Il est également possible d’étendre DITA afin de permettre la définition de types d’informations.

  • DITA est basée sur les rubriques. Elle fournit trois types de rubriques de base, mais permet de spécialiser ces types en fonction des besoins.

  • DITA utilise un mappage DITA qui contient des liens vers les fichiers XML dans l’ensemble de documentation. Chaque fichier XML peut être une rubrique ou une collection de rubriques.

  • FrameMaker peut publier du contenu DITA aux formats PDF, Responsive HTML5, applications mobiles pour iOS et Android, EPUB, Kindle, Microsoft HTML Help (CHM) et Basic HTML.

DocBook

DocBook est une norme ouverte, conçue pour les articles et la documentation techniques. DocBook fournit une DTD pour l’écriture de livres et d’articles techniques, avec une structure adaptée à ce type de documents.

Parmi les éléments typiques de DocBook, on trouve par exemple <article>, <section>, <title>, <articleinfo> et <pubdate>.

Vous trouverez ci-dessous certaines des fonctions propres à DocBook :

  • DocBook est axé sur les livres ou les chapitres.

  • DocBook est hiérarchique de nature et doit être développé pour une publication à source unique. Le contenu est dépendant de son contexte.

  • DocBook dispose d’un ensemble d’éléments et d’attributs fixe mais de grande taille.

  • DocBook fournit un fichier XML include qui contient tous les autres fichiers.

  • Parmi les formats de sortie DocBook, on trouve les formats PDF, HTML et HTML Help. Il est possible de l’étendre à d’autres formats de sortie avec du travail de développement.