Page de code

La page de code de est le terme traditionnel d'IBM utilisé pour une table spécifique du codage de caractère de : une cartographie dans ce qu'un ordre du peu habituellement un octet simple représentant les valeurs de nombre entier 0 à 255, est associé à un caractère spécifique . Le IBM et le Microsoft assignent souvent un numéro de page de code à un jeu de caractères même si ce charset de est mieux connu par un autre nom.

Tandis que la page de code de de limite provenait de l'EBCDIC - systèmes basés du d'IBM d'unité centrale, < ! --une certaine information aux pages de code d'EBCDIC serait gentille--> la limite est le plus généralement associée aux pages de code de PC d'IBM. Le Microsoft , un fabricant des logiciels d'exploitation de de PC se rapporte à ces pages de code comme les pages de code d'OEM de , et les complète avec son propre " ; " de la norme ANSI ; pages de code.

La plupart des pages de code bien connues, à l'exclusion de ceux pour les langues et le vietnamien du CJK , < ! --pas using CJKV ici parce que ceci s'applique aux Vietnamiens romanised modernes--> représenter les jeux de caractères qui s'adaptent dans 8 bits et n'impliquer rien qui ne peut pas être représenté en traçant chaque code à une carte binaire simple, telle que combiner des caractères, des manuscrits complexes, etc.

Le mode des textes (le VGA compatible) du matériel standard de graphiques de PC est établi autour d'employer une page de code du bit 8, bien qu'il soit possible d'employer deux immédiatement avec un certain sacrifice d'intensité de la couleur, et jusqu'au 8 mai soit stocké dans l'adapteur d'affichage pour la commutation facile. Il y avait un choix de pages< de code ! --n'importe qui savent si ceux-ci venaient d'IBM ou de la milliseconde ? --> qui pourrait être chargé dans un tel matériel. Cependant, il est maintenant banal que les fournisseurs du système d'exploitation fournissent leurs propres systèmes de codage et de rendu de caractère qui fonctionnent en mode de graphiques et dévient ce système entièrement. Les codages de caractère employés par ces systèmes graphiques (en particulier Windows) s'appellent aussi bien parfois les pages de code.

Rapport avec l'ASCII

La base des pages de code de PC d'IBM est le ASCII , un code du bit 7 représentant 128 caractères et codes de commande. Dans le passé, les prolongements à 8 bits à l'ASCII codent souvent l'ensemble le peu supérieur à zéro, ou utilisé lui comme bit de parité dans des transmissions de données de réseau. Quand ce peu a été à la place rendu disponible pour représenter des données-caractères, des 128 caractères et codes de commande différents pourraient être représentés. IBM a employé cette gamme prolongée pour coder des caractères employés par de diverses langues. Aucune norme formelle n'a existé pour ces jeux de caractères prolongés par de `' ; IBM s'est simplement rapporté aux variantes comme pages de code, comme il avait toujours fait pour des variantes des codages de l'EBCDIC .

Pages de code du PC d'IBM (OEM)

Ces pages de code sont le MS-DOS de dessous le plus employé souvent - comme des logiciels d'exploitation ; elles incluent beaucoup de caractères de schéma de boîte de . Puisque la page de code originale de PC d'IBM (numéro 437 ) n'a pas été vraiment conçue pour l'usage international, plusieurs variantes incompatibles ont émergé. Microsoft se rapporte à ces derniers comme pages de code d'OEM. Les exemples incluent :
  • 437 — Le &mdash original du 737 de

  • de la page de code de PC d'IBM
  • ; &mdash grec du 850 de
  • du
  • ; " ; " (Latin-1) multilingue ; (Langues d'Europe occidentale) &mdash du 852 de
    ; " ; " (Latin-2) slave ; (Oriental - langues européennes) &mdash du 855 de
    ; &mdash cyrillien du 857 de
  • du
  • ; &mdash turc du 858 de
  • du
  • ; " ; Multilingual" ; avec l'euro &mdash du 860 de
  • du symbole
  • du ; &mdash portugais du 861 de
  • du
  • ; &mdash islandais du 863 de
  • du
  • ; &mdash canadien du 865 de
  • du français
  • du ; &mdash du 862 de
  • du Nordic
  • de ; &mdash hébreu du 866 de
  • du
  • ; &mdash cyrillien du 869 de
  • du
  • ; grec

D'autres pages de code de note

  • 10000 — &mdash romain du 10007 de
  • du codage (suivi de plusieurs autres jeux de caractères de Mac)
  • de Macintosh de ; &mdash cyrillien du 10029 de
  • du codage
  • de Macintosh de ; &mdash de l'Europe centrale du 932 de
  • du codage
  • de Macintosh de ; &mdash japonais du 936 de
  • de soutiens
  • ; &mdash du 949 de
  • du Chinois simplifié
  • de soutiens du GBK ; &mdash coréen du 950 de
  • de soutiens
  • ; &mdash du 1200 de
  • du chinois traditionnel
  • de soutiens ; D'UCS-2LE de d'Unicode Petit-endian &mdash du 1201 de
  • du ; D'UCS-2BE de d'Unicode Grand-endian
  • &mdash du 65000 de
  • du ; UTF-7 Unicode
  • 65001 — UTF-8 Unicode
  • ASMO449+ — &mdash arabe du MIK de
  • de soutiens
  • ; Appuis bulgares et Russe aussi bien

Dans des applications modernes, des logiciels d'exploitation et les langages de programmation, les pages de code d'IBM ont été rendus désuets par de plus nouvelles et meilleures normes internationales, telles qu'OIN 8859-1 et Unicode .

Pages de code de Windows (norme ANSI)

défini par de Microsoft de un certain nombre de pages de code connues sous le nom de pages de code de norme ANSI (en tant que premier, 1252 a été basé sur une ébauche apocryphe de norme ANSI de ce qui est devenu OIN 8859-1 ). La page de code 1252 est construite sur OIN 8859-1 mais des utilisations que la gamme 0x80-0x9F pour les caractères imprimables supplémentaires plutôt que les codes de commande C1 a employées dans le ISO-8859-1 . Certaines des autres sont basées en partie sur d'autres parties d'OIN 8859 mais souvent réarrangées pour les faire plus près de 1252.
  • 1250 — &mdash de l'Europe de l'est du 1251 de

  • du latin
  • ; &mdash cyrillien du 1252 de
  • du
  • ; &mdash de l'europe de l'ouest du 1253 de
  • du latin
  • ; &mdash grec du 1254 de
  • du
  • ; &mdash turc du 1255 de
  • du
  • ; &mdash hébreu du 1256 de
  • du
  • ; &mdash arabe du 1257 de
  • du
  • ; &mdash baltique du 1258 de
  • du
  • ; vietnamien

Critique

Beaucoup de produits par Microsoft et d'autres compagnies emploient les pages de code de Microsoft pour coder leur texte. Ceci signifie que l'autre logiciel doit choisir entre le
ne fonctionnant pas avec des documents produits avec ces le mis-rendu de
  • des applications
  • le texte dans le
  • de la question
  • ajoutant le soutien des pages de code de Microsoft, en effet faisant à l'exécution de Microsoft un norme de fait de .

    Que ces derniers et d'autres raisons il est préférable codent des données dans Unicode au lieu d'employer les pages de code de legs.

    Noter que l'arrivée du Unicode et du XML a rendu la plupart de ces problèmes désuètes, parce qu'elle fournit et impose dans une certaine mesure clairement des étiquettes pour le codage de caractère.

    Les applications peuvent également mal étiqueter le texte dans le Windows-1252 comme ISO-8859-1 , le jeu de caractères de défaut pour le HTML. Heureusement la seule différence entre ces pages de code est que les réservations de la gamme ISO-8859-1 pour les caractères de commande, les utilisations Windows-1252 pour les caractères imprimables spéciaux. Puisque les caractères de commande n'ont aucune fonction dans le HTML, les navigateurs de Web tendent à employer Windows-1252 plutôt qu'ISO-8859-1.

    Pages de code privé

    Quand, tôt dans l'histoire des PCs, les utilisateurs n'ont pas trouvé leurs besoins de codage de caractère répondus, des pages de code privé ou local ont été créées using le terminent et restent les utilités résidentes de ou en reprogrammant le EPROM de BIOS dans certains cas, des numéros de page officieux de code ont été inventés ( par exemple , cp895).

    Quand un appui plus divers de jeu de caractères est devenu disponible la plupart de ces pages de code est tombé dans la désuétude, à certaines exceptions telles que le le codage ou KEYBCS2 de Kamenický pour le des alphabets slovaques tchèques de et . Un autre jeu de caractères est système de l'Iran de codant standard qui a été créé par société de système de l'Iran pour l'appui persan de langue. Cette norme était en service en Iran dans des programmes DOS-basés et après l'introduction de la page de code de Microsoft 1256 cette norme est devenue désuète. Programmes cependant quelques de Windows et de DOS using ce codage sont encore en service et quelques polices de Windows avec ce codage existent.

    Voir également codage de caractère de de

    .

    Random links:QI | Richard Lyon | Ahmed Abdallah | Alex Witt | Vince DeMentri | Página_de_código