Кодовая таблица windows ansi

Таблицы кодировок ASCII, CP1251 (windows1251), ISO-8859-5

Таблица ASCII

Таблица ASCII (American standard code for information interchange) является мировым стандартом для кодирования букв английского алфавита, популярных спец символов (! $ # % & и т.д.) и некоторых непечатных символов (например, возврат каретки 0x0D и перенос строки 0х0А).

Таблица создавалась те времена, когда возникла необходимость связать символы и числа. А такое соответствие необходимо было для того что бы с помощью чисел можно было передать текстовое сообщение между разными устройствами с цифровой связью.

Таблица CP1251 (windows-1251)

Эта кодировочная таблица может называться или CP1251 или Windows-1251 Это стандарт кодирования кириллических символов в операционных системах windows с русскоязычным интерфейсом.

Первая часть этой таблицы (до байта 0x7F) повторяет таблицу ASCII, а вторая часть (от 0x80 до 0xFF) кодирует кириллические символы в алфавитном порядке.

Таблица IS0-8859-5

Эта кодировка применяется в дисплеях Nextion для кодирования кириллических символов.

Стоит обратить внимание, что в данной таблице кириллические символы расположены в алфавитном порядке и сдвинуты ровно на 16 байт по сравнению с кодировочной таблицей windows-1251.

Кодировка UTF-8
(Unicode Transformation Format)

Очень распространенный формат кодирования символов, позволяющий кодировать символы переменным количеством байт.

Например, если для кодирования номера символа требуется 21 бит, то используется 4 байта для кодировки. Если для кодирования достаточно 11 бит, то используют 2 байта. А если номер символа может быть закодирован 7 битами, то используется один байт.

Все ASCII символы в кодировке UTF8 закодированы без изменений, то есть 1 байтом, как в стандартной таблице ASCII.

А вот остальные символы закодированы количеством байт от 2 до 4.

Кириллические символы закодированы двумя байтами.

ASCII таблица

ASCIIA merican S tandard C ode for I nformation I nterchange.

ASCII была разработана (1963 год) для кодирования символов, коды которых помещались в 7 бит (128 символов). Со временем кодировка была расширена до 8-ми бит (256 символов), коды первых 128-и символов не изменились.

Управляющие символы ASCII (код символа 0-31)

Первые 32 символа в ASCII-таблице не имеют печатных кодов и используются для управления периферийными устройствами, телетайпами, принтерами и т.д.

DEC OCT HEX BIN Symbol HTML Number HTML Name Description
0 000 0x00 00000000 NUL \0 & #000; Null char
1 001 0x01 00000001 SOH & #001; Start of Heading
2 002 0x02 00000010 STX & #002; Start of Text
3 003 0x03 00000011 ETX & #003; End of Text
4 004 0x04 00000100 EOT & #004; End of Transmission
5 005 0x05 00000101 ENQ & #005; Enquiry
6 006 0x06 00000110 ACK & #006; Acknowledgment
7 007 0x07 00000111 BEL & #007; Bell
8 010 0x08 00001000 BS & #008; Back Space
9 011 0x09 00001001 HT \t & #009; Tab
10 012 0x0A 00001010 LF \n & #010; Новая строка
11 013 0x0B 00001011 VT & #011; Vertical Tab
12 014 0x0C 00001100 FF & #012; Form Feed
13 015 0x0D 00001101 CR \r & #013; Возврат каретки
14 016 0x0E 00001110 SO & #014; Shift Out / X-On
15 017 0x0F 00001111 SI & #015; Shift In / X-Off
16 020 0x10 00010000 DLE & #016; Data Line Escape
17 021 0x11 00010001 DC1 & #017; Device Control 1 (oft. XON)
18 022 0x12 00010010 DC2 & #018; Device Control 2
19 023 0x13 00010011 DC3 & #019; Device Control 3 (oft. XOFF)
20 024 0x14 00010100 DC4 & #020; Device Control 4
21 025 0x15 00010101 NAK & #021; Negative Acknowledgement
22 026 0x16 00010110 SYN & #022; Synchronous Idle
23 027 0x17 00010111 ETB & #023; End of Transmit Block
24 030 0x18 00011000 CAN & #024; Cancel
25 031 0x19 00011001 EM & #025; End of Medium
26 032 0x1A 00011010 SUB & #026; Substitute
27 033 0x1B 00011011 ESC & #027; Escape
28 034 0x1C 00011100 FS & #028; File Separator
29 035 0x1D 00011101 GS & #029; Group Separator
30 036 0x1E 00011110 RS & #030; Record Separator
31 037 0x1F 00011111 US & #031; Unit Separator
DEC OCT HEX BIN Symbol HTML Number HTML Name Description
Читайте также:  Компонент windows защищенный узел
Печатные символы ASCII (код символа 32-127)

Буквы, цифры, знаки препинания и другие символы расположенные на клавиатуре (англ.).

Что такое кодировка ANSI и с чем ее едят?

Прежде чем отвечать на вопрос о том, что же такое кодировка ANSI Windows, ответим сначала на другой вопрос: «Что же такое кодировка вообще?»

У каждого компьютера, в каждой системе используется определенный набор символов, зависящий от языка, используемого пользователем, от его профессиональных компетенций и личных предпочтений.

Общее определение кодировки

Так, в русском языке используется 33 символа для обозначения букв, в английском – 26. Также используется 10 цифр для счета (0; 1; 2; 3; 4; 5; 6; 7; 8; 9) и некоторые специальные символы, в том числе запятая, минус, пробел, точка, процент и так далее.

Каждому из этих символов при помощи кодовой таблицы присваивается порядковый номер. К примеру, букве «A» может быть присвоен номер 1; «Z» — 26 и так далее.

Собственно, номер, представляющий символ как целое число, считается кодом символа, а кодировка — это, соответственно, набор символов в такой таблице.

Богатство разнообразия кодовых таблиц

На данный момент существует довольно большое количество кодировок и кодовых таблиц, используемых разными специалистами: это и ASCII, разработанная в 1963 году в Америке, и Windows-1251, совсем недавно еще бывшая популярной благодаря Microsoft, KOI8-R и Guobiao — и многие, многие другие, причем процесс их появления и отмирания происходит и по сей день.

Среди этого огромного списка совершенно особо держится так называемая кодировка ANSI.

Дело в том, что в свое время компания Microsoft создала целый набор кодовых страниц:

Windows — 874 Тайский
Windows-1250 Центральноевропейский
Windows-1251 Кириллический (все символы русского языка + символы близких языков)
Windows-1252 Западноевропейский
Windows-1253 Греческий
Windows-1254 Турецкий
Windows-1255 Еврейский
Windows-1256 Арабский
Windows-1257 Балтийский
Windows-1258 Вьетнамский

Все они получили общее название таблицы кодировки ANSI, или кодовой страницы ANSI.

Интересный факт: одной из первых кодовых таблиц стала ASCII, в 1963 году созданная American National Standards Institute (Американским национальным институтом стандартов), сокращенно называвшимся именно ANSI.

Помимо всего прочего, эта кодировка содержит и непечатные символы, так называемые «Управляющие последовательности», или ESC, уникальные для всех таблиц символов, зачастую несовместимые между собой. При умелом использовании, однако, они позволяли скрывать и восстанавливать курсор, переводить его с одного положения в тексте на другое, устанавливать табуляцию, стирать часть окна терминала, в котором велась работа, изменять форматирование текста на экране и менять цвет (или даже рисовать и подавать звуковые сигналы!). В 1976 году, кстати, это было довольно неплохим подспорьем для программистов. Кстати, терминал — это устройство, требующееся для ввода и вывода информации. В те далекие времена он представлял собой монитор и клавиатуру, подсоединенные к ЭВМ (электронной вычислительной машине).

Некорректное отображение символов

К сожалению, в дальнейшем подобная система вызвала многочисленные сбои в системах, выводя вместо желаемых стихов, лент новостей или описаний любимых компьютерных игр так называемые кракозябры бессмысленные, нечитаемые наборы символов. Появление этих вездесущих ошибок было вызвано всего лишь попыткой отображать символы, закодированные в одной кодовой таблице, при помощи другой.

Чаще всего с последствиями неверного чтения этой кодировки мы сталкиваемся в Интернете до сих пор, когда наш браузер по какой-то причине не может достаточно точно определить, какая именно из Windows-**** кодировок используется в данный момент, из-за указания веб-мастером общей кодировки ANSI либо изначально неверной кодировки, к примеру, 1252 вместо 1521. Ниже представлена точная таблица кодировок.

HTML Windows-1252 (ANSI) Справочник

Windows-1252

Windows-1252 был первым набором символов по умолчанию в Microsoft Windows.

Это был самый популярный набор символов в Windows с 1985 по 1990 годы.

Исторически термин «ANSI Code Pages» использовался в Windows для обозначения наборов символов, не относящихся к DOS.

Предполагалось, что эти наборы символов будут соответствовать стандартам ANSI, таким как ISO-8859-1.

Несмотря на то, что Windows-1252 практически идентична ISO-8859-1, она никогда не была стандартом ANSI или ISO.

Windows-1252 и ASCII

Первая часть Windows-1252 (номера символов от 0 до 127) — это оригинальный набор символов ASCII. Он содержит цифры, прописные и строчные буквы английского алфавита и некоторые специальные символы.

Читайте также:  Linux bash find command

Для более детального ознакомления, пожалуйста, изучите наш Полный справочник ASCII.

Набор символов Windows-1252

Символ Число Символьное имя Описание
0 — 31 Control characters (see below)
32 space
! 33 exclamation mark
« 34 " quotation mark
# 35 number sign
$ 36 dollar sign
% 37 percent sign
& 38 & ampersand
39 apostrophe
( 40 left parenthesis
) 41 right parenthesis
* 42 asterisk
+ 43 plus sign
, 44 comma
45 hyphen-minus
. 46 full stop
/ 47 solidus
0 48 digit zero
1 49 digit one
2 50 digit two
3 51 digit three
4 52 digit four
5 53 digit five
6 54 digit six
7 55 digit seven
8 56 digit eight
9 57 digit nine
: 58 colon
; 59 semicolon
62 > greater-than sign
? 63 question mark
@ 64 commercial at
A 65 Latin capital letter A
B 66 Latin capital letter B
C 67 Latin capital letter C
D 68 Latin capital letter D
E 69 Latin capital letter E
F 70 Latin capital letter F
G 71 Latin capital letter G
H 72 Latin capital letter H
I 73 Latin capital letter I
J 74 Latin capital letter J
K 75 Latin capital letter K
L 76 Latin capital letter L
M 77 Latin capital letter M
N 78 Latin capital letter N
O 79 Latin capital letter O
P 80 Latin capital letter P
Q 81 Latin capital letter Q
R 82 Latin capital letter R
S 83 Latin capital letter S
T 84 Latin capital letter T
U 85 Latin capital letter U
V 86 Latin capital letter V
W 87 Latin capital letter W
X 88 Latin capital letter X
Y 89 Latin capital letter Y
Z 90 Latin capital letter Z
[ 91 left square bracket
\ 92 reverse solidus
] 93 right square bracket
^ 94 circumflex accent
_ 95 low line
` 96 grave accent
a 97 Latin small letter a
b 98 Latin small letter b
c 99 Latin small letter c
d 100 Latin small letter d
e 101 Latin small letter e
f 102 Latin small letter f
g 103 Latin small letter g
h 104 Latin small letter h
i 105 Latin small letter i
j 106 Latin small letter j
k 107 Latin small letter k
l 108 Latin small letter l
m 109 Latin small letter m
n 110 Latin small letter n
o 111 Latin small letter o
p 112 Latin small letter p
q 113 Latin small letter q
r 114 Latin small letter r
s 115 Latin small letter s
t 116 Latin small letter t
u 117 Latin small letter u
v 118 Latin small letter v
w 119 Latin small letter w
x 120 Latin small letter x
y 121 Latin small letter y
z 122 Latin small letter z
< 123 left curly bracket
| 124 vertical line
> 125 right curly bracket
126 tilde
127 Control character (see below)
128 euro sign
129 NOT USED
130 single low-9 quotation mark
ƒ 131 ƒ Latin small letter f with hook
132 double low-9 quotation mark
133 horizontal ellipsis
134 dagger
135 double dagger
ˆ 136 ˆ modifier letter circumflex accent
137 per mille sign
Š 138 Š Latin capital letter S with caron
139 single left-pointing angle quotation mark
Œ 140 Œ Latin capital ligature OE
141 NOT USED
Ž 142 Ž Latin capital letter Z with caron
143 NOT USED
144 NOT USED
145 left single quotation mark
146 right single quotation mark
147 left double quotation mark
148 right double quotation mark
149 bullet
150 en dash
151 em dash
˜ 152 ˜ small tilde
153 trade mark sign
š 154 š Latin small letter s with caron
155 single right-pointing angle quotation mark
œ 156 œ Latin small ligature oe
157 NOT USED
ž 158 ž Latin small letter z with caron
Ÿ 159 Ÿ Latin capital letter Y with diaeresis
160 no-break space
¡ 161 ¡ inverted exclamation mark
¢ 162 ¢ cent sign
£ 163 £ pound sign
¤ 164 ¤ currency sign
¥ 165 ¥ yen sign
¦ 166 ¦ broken bar
§ 167 § section sign
¨ 168 ¨ diaeresis
© 169 © copyright sign
ª 170 ª feminine ordinal indicator
« 171 « left-pointing double angle quotation mark
¬ 172 ¬ not sign
�­ 173 ­ soft hyphen
® 174 ® registered sign
¯ 175 ¯ macron
° 176 ° degree sign
± 177 ± plus-minus sign
² 178 ² superscript two
³ 179 ³ superscript three
´ 180 ´ acute accent
µ 181 µ micro sign
182 pilcrow sign
· 183 · middle dot
¸ 184 ¸ cedilla
¹ 185 ¹ superscript one
º 186 º masculine ordinal indicator
» 187 » right-pointing double angle quotation mark
¼ 188 ¼ vulgar fraction one quarter
½ 189 ½ vulgar fraction one half
¾ 190 ¾ vulgar fraction three quarters
¿ 191 ¿ inverted question mark
À 192 À Latin capital letter A with grave
Á 193 Á Latin capital letter A with acute
 194  Latin capital letter A with circumflex
à 195 à Latin capital letter A with tilde
Ä 196 Ä Latin capital letter A with diaeresis
Å 197 Å Latin capital letter A with ring above
Æ 198 Æ Latin capital letter AE
Ç 199 Ç Latin capital letter C with cedilla
È 200 È Latin capital letter E with grave
É 201 É Latin capital letter E with acute
Ê 202 Ê Latin capital letter E with circumflex
Ë 203 Ë Latin capital letter E with diaeresis
Ì 204 Ì Latin capital letter I with grave
Í 205 Í Latin capital letter I with acute
Î 206 Î Latin capital letter I with circumflex
Ï 207 Ï Latin capital letter I with diaeresis
Ð 208 Ð Latin capital letter Eth
Ñ 209 Ñ Latin capital letter N with tilde
Ò 210 Ò Latin capital letter O with grave
Ó 211 Ó Latin capital letter O with acute
Ô 212 Ô Latin capital letter O with circumflex
Õ 213 Õ Latin capital letter O with tilde
Ö 214 Ö Latin capital letter O with diaeresis
× 215 × multiplication sign
Ø 216 Ø Latin capital letter O with stroke
Ù 217 Ù Latin capital letter U with grave
Ú 218 Ú Latin capital letter U with acute
Û 219 Û Latin capital letter U with circumflex
Ü 220 Ü Latin capital letter U with diaeresis
Ý 221 Ý Latin capital letter Y with acute
Þ 222 Þ Latin capital letter Thorn
ß 223 ß Latin small letter sharp s
à 224 à Latin small letter a with grave
á 225 á Latin small letter a with acute
â 226 â Latin small letter a with circumflex
ã 227 ã Latin small letter a with tilde
ä 228 ä Latin small letter a with diaeresis
å 229 å Latin small letter a with ring above
æ 230 æ Latin small letter ae
ç 231 ç Latin small letter c with cedilla
è 232 è Latin small letter e with grave
é 233 é Latin small letter e with acute
ê 234 ê Latin small letter e with circumflex
ë 235 ë Latin small letter e with diaeresis
ì 236 ì Latin small letter i with grave
í 237 í Latin small letter i with acute
î 238 î Latin small letter i with circumflex
ï 239 ï Latin small letter i with diaeresis
ð 240 ð Latin small letter eth
ñ 241 ñ Latin small letter n with tilde
ò 242 ò Latin small letter o with grave
ó 243 ó Latin small letter o with acute
ô 244 ô Latin small letter o with circumflex
õ 245 õ Latin small letter o with tilde
ö 246 ö Latin small letter o with diaeresis
÷ 247 ÷ division sign
ø 248 ø Latin small letter o with stroke
ù 249 ù Latin small letter u with grave
ú 250 ú Latin small letter u with acute
û 251 û Latin small letter with circumflex
ü 252 ü Latin small letter u with diaeresis
ý 253 ý Latin small letter y with acute
þ 254 þ Latin small letter thorn
ÿ 255 ÿ Latin small letter y with diaeresis

Управляющие символы

Управляющие символы (диапазон 00-31, плюс 127) предназначены для управления аппаратными устройствами.

Управляющие символы (кроме горизонтальной табуляции, перевода строки и возврата каретки) не имеют никакого отношения к документу HTML.

Читайте также:  При форматировании жесткого диска windows не удается завершить форматирование
Оцените статью