Texte composé
Le a composé le texte , le texte dénommé par ou le texte riche , par opposition au texte plat , a dénommer l'information au delà du minimum d'éléments sémantiques : couleurs, modèles (caractères gras, italique), tailles et usages spéciaux (tels que liens hypertextes .
Terminologie
Le texte composé ne peut pas correctement être identifié avec les dossiers binaires ou être distinct du texte d'ASCII. C'est parce que le texte composé n'est pas nécessairement binaire, il peut être text-only, tel que HTML , rtf ou dossiers enrichis par des textes , et ce peut être ASCII-seulement. Réciproquement, un dossier des textes plats peut être non-ASCII (dans un codage tel que UTF-8 d'Unicode ). Le texte composé par Text-only est réalisé par le marge bénéficiaire bénéficiaire qui est aussi textuel, alors que quelques rédacteurs de texte composé comme le Microsoft Word économisent dans un format binaire.
Commencement de texte composé
Le texte composé a sa genèse dans les premiers systèmes interactifs, où les utilisateurs ont compensé le manque de composition dans l'ASCII en employant certains symboles en tant que produits de remplacement. L'emphase, par exemple, a pu être réalisée dans l'ASCII d'un certain nombre de manières :
Capitalisation de
: I AM ne faisant pas cet up.
Entourage avec des soulignages : _not_ du I AM faisant cet up.
Entourage avec des astérisques : *not* du I AM faisant cet up.
Espacement : I AM n o t faisant cet up.
L'entourage par des soulignages a été également employé pour des titres de livre : Look il vers le haut dans _The_C_Programming_Language_.
Langages de balisage article principal de de de
: Langages de balisageLe formatage peut être marqué par des étiquettes distinguées du texte de corps par les caractères spéciaux, tels que des chevrons dans HTML . Par exemple, ce texte :
Le chien est classifié en tant que familiaris de lupus de Canis de en taxonomie.
est marqué vers le haut dans ainsi HTML :
< ; p> ; Le chien est classifié comme < ; i> ; Familiaris< de lupus de Canis ; /i> ; dans taxonomy.< ; /p> ;
Le texte en italiques est enfermé par une ouverture et les italiques fermants étiquettent. Dans le TeX , le texte serait marqué vers le haut comme ceci :
le chien de The est classifié comme \ textit {familiaris de lupus de Canis} dans taxonomy.
Des langages de balisage peuvent être mis en application avec n'importe quel éditeur de texte , n'ayant besoin d'aucun logiciel spécial .
Dossiers de document composés
Depuis l'invention du MacWrite , la première unité de traitement de texte de l'impression conforme à la visualisation , dans laquelle le dactylo code le formatage visuellement plutôt qu'en insérant le marge bénéficiaire bénéficiaire textuel, les unités de traitement de texte ont tendu à sauver aux dossiers binaires. L'ouverture de tels dossiers avec un éditeur de texte indique le texte embelli avec de divers caractères binaires, ou autour des secteurs composés (par exemple dans WordPerfect) ou séparément, au début ou de l'extrémité du dossier (par exemple dans Microsoft Word ).
Les documents composés des textes dans les dossiers binaires ont, cependant, les inconvénients de la portée et du secret de formatage. Considérant que l'ampleur du formatage est exactement marquée dans des langages de balisage, le formatage de l'impression conforme à la visualisation est basé sur la mémoire, c., gardant par exemple votre pressurage du bouton en caractères gras jusqu'à décommander. Ceci peut mener aux erreurs de formatage et aux ennuis d'entretien. Quant au secret, les formats de fichier composés de document des textes tendent à être de propriété industrielle et non documenté, introduire ensuite la difficulté en codant la compatibilité par les tiers, et également aux mises à niveau inutiles en raison de la version change.
l'auteur d'OpenOffice.org sauve des dossiers dans un format du XML . Cependant, le dossier résultant est une binaire puisqu'il est comprimé (un équivalent de Tarball ).
Pdf est un autre format de fichier composé des textes qui est habituellement binaire (using la compression pour le texte, et stocker des graphiques et des polices dans la binaire). C'est généralement un format d'utilisateur, écrit d'une application telle que le Microsoft Word ou l'auteur d'OpenOffice.org , et non editable par l'utilisateur une fois fait.
Voir également
Codage des textes de < ! -- section déplacée du codage des textes de --> < ! -- Tout c'est joli beaucoup faux, je pensent. Il contient l'information de naïve. Formatage des textes de ≠ de codage des textes. pendant qu'un ordre de code (d'un codage de caractère de ) afin de la mémoire interne ou de la communication électronique de ce texte. Tandis que les codages de caractère comme le ASCII représentent les différents caractères d'une langue , un codage des textes doit représenter des choses beaucoup plus grandes comme les articles et les livres et doit représenter non seulement les caractères qu'ils contiennent mais la structure et l'organisation du texte, et peut-être les informations sur le texte ou son aspect . Les exemples communs sont HTML et rtf qui représentent des textes dans les langages naturels et le XML , qui peuvent représenter beaucoup de genres de texte pas nécessairement prévus pour être lisibles pour l'homme (le contenu d'une base de données , par exemple).
En général il y a deux formes de base de codage des textes qui sont employées couramment. On est d'employer un langage de balisage qui ajoute les marqueurs au texte lui-même. Il a l'avantage d'être facile à représenter, mais à avoir l'inconvénient d'être difficile de regarder le marge bénéficiaire bénéficiaire sans " ; aware" ; Application de lecteur de . Par exemple, si un document de HTML est ouvert dans un éditeur de texte , il est en grande partie lisible, mais le texte est encombré avec des codes, et encore plus dans le cas d'une table, et il y a des références de caractère pour les caractères spéciaux qui peuvent rendre des pièces illisibles, au moins à ceux peu familiers avec le format. Une autre méthode est d'employer le " ; Quot des indicateurs ; dans le texte, qui est laissé dans le format original. Ceci a l'avantage de permettre au contenu d'être facilement lisible dans n'importe quel rédacteur , bien que vous perdiez le " ; dénommant le " de ;. En baisse, l'édition d'un tel document dans une application non-avertie laisse typiquement les indicateurs indiquant les données fausses . Aujourd'hui la majorité de systèmes de codage des textes semblent employer le marge bénéficiaire bénéficiaire, bien que par le choix ou simplement parce que " ; chacun does" d'autre ; est discutable.
Bien que les codages de caractère comme le ASCII et le Unicode ne soient pas, à proprement parler, des codages des textes de leur propre chef, ils peuvent servir de codages très simples des textes si on souhaite préserver seulement la teneur anglaise en d'un document et pas nécessairement de son formatage . De loin le codage le plus commun des textes est maintenant en service ce qui pourrait officieusement s'appeler le " ; ASCII" plat ; , qui implique de coder simplement un texte comme jet des caractères d'ASCII. Les détails de la façon dont ceci est fait varient considérablement : par exemple, l'extrémité d'une ligne des textes de pourrait être codée comme code 10 (" d'ASCII ; " de retour à la ligne ; ou " ; nouveau line" ;) de même que pratique commune sur des machines d'Unix , ou comme code 13 (" d'ASCII ; " du retour de chariot ;) de même que commun sur des machines d'Apple , ou en tant que tous les deux (l'ordre <13, 10> est employé aux lignes d'extrémité sur les machines basées par de DOS de et beaucoup d'autres, alors que l'ordre plutôt rare <10, 13> était employé par quelques machines du gland ). Quelques textes emploient également cet ordre de ligne-extrémité à l'intérieur des paragraphes (avec un interligne entre les paragraphes) alors que certains ne font pas. En outre, les divers textes sous cette forme interprètent le code 9 (" ; tab" ;) et d'autres caractères de commande différemment. Aucune de ces méthodes ne spécifie comment identifier la structure des textes comme les titres et les Tableaux ou les formes spéciales des textes comme les italiques . Le texte dans ce format est fondamentalement lisible par n'importe quel ordinateur bien qu'un certain travail pourrait être nécessaire pour adapter à des variations locales, et toute l'information sans compter que les mots réels du texte sera perdu.
| Random links: | Magnésium | Coopératif | Compartiment de Gardiners | Place rouge (bande) | Sillage (genre) | Texto_formatado |