ASCII 码使用指定的 7 位或 8 位二进制数组合来表示 128 或 256 种可能的字符。标准 ASCII 码也叫基础ASCII码,使用 7 位二进制数来表示所有的大写和小写字母,数字 0 到 9、标点符号, 以及在美式英语中使用的特殊控制字符。其中:
0~31及127(共33个)是控制字符或通信专用字符(其余为可显示字符),如控制符:LF(换行)、CR(回车)、FF(换页)、DEL(删除)、BS(退格)、BEL(振铃)等;通信专用字符:SOH(文头)、EOT(文尾)、ACK(确认)等;ASCII值为 8、9、10 和 13 分别转换为退格、制表、换行和回车字符。它们并没有特定的图形显示,但会依不同的应用程序,而对文本显示有不同的影响。
32~126(共95个)是字符(32sp是空格),其中48~57为0到9十个阿拉伯数字;
65~90为26个大写英文字母,97~122号为26个小写英文字母,其余为一些标点符号、运算符号等。
同时还要注意,在标准ASCII中,其最高位(b7)用作奇偶校验位。所谓奇偶校验,是指在代码传送过程中用来检验是否出现错误的一种方法,一般分奇校验和偶校验两种。奇校验规定:正确的代码一个字节中1的个数必须是奇数,若非奇数,则在最高位b7添1;偶校验规定:正确的代码一个字节中1的个数必须是偶数,若非偶数,则在最高位b7添1。
后128个称为扩展ASCII码,目前许多基于x86的系统都支持使用扩展(或“高”)ASCII。扩展 ASCII 码允许将每个字符的第 8 位用于确定附加的 128 个特殊符号字符、外来语字母和图形符号。
在计算机中,所有的数据在存储和运算时都要使用二进制数表示(因为计算机用高电平和低电平分别表示1和0),例如,象a、b、c、d这样的52个字母(包括大写)、以及0、1等数字还有一些常用的符号(例如*、#、@等)在计算机中存储时也要使用二进制数来表示,而具体用哪些二进制数字表示哪个符号,当然每个人都可以约定自己的一套(这就叫编码),而大家如果要想互相通信而不造成混乱,那么大家就必须使用相同的编码规则,于是美国有关的标准化组织就出台了所谓的ASCII编码,统一规定了上述常用符号用哪些二进制数来表示。
美国标准信息交换代码是由美国国家标准学会(American National Standard Institute , ANSI )制定的,标准的单字节字符编码方案,用于基于文本的数据。起始于50年代后期,在1967年定案。它最初是美国国家标准,供不同计算机在相互通信时用作共同遵守的西文字符编码标准,它已被国际标准化组织(International Organization for Standardization, ISO)定为国际标准,称为ISO 646标准。适用于所有拉丁文字字母。
A在ascii中定义为01000001,也就是十进制65,有了这个标准后,当我们输入A时,计算机就可以通过ascii码知道输入的字符的二进制编码是01000001。而没有这样的标准,我们就必须自己想办法告诉计算机我们输入了一个A;没有这样的标准,我们在别的机器上就需要重新编码以告诉计算机我们要输入A。ascii码指的不是十进制,是二进制。只是用十进制表示习惯一点罢了,比如在ascii码中,A的二进制编码为01000001,如果用十进制表示是65,用十六进制表示就是41H。
在ascii码表中,只包括了一些字符、数字、标点符号的信息表示,这主要是因为计算机是美国发明的,在英文下面,我们使用ascii表示就足够了!但是在汉字输入下面,用ascii码就不能表示了,而汉字只是中国的通用表示,所以如果我们要在计算机中输入汉字,就必须有一个像ascii码的标准来表示每一个汉字,这就是中国的汉字国标码,它定义了汉字在计算机中的一个表示标准。通过这个标准,但我们输入汉字的时候,我们的输入码就转换为区位码,通过唯一的区位码得到这个汉字的字形码并显示出来。当然汉字的区位码在计算机中也是用二进制表示的!
0-127 是 7位ASCII 码的范围,是国际标准。
至于汉字,不同的字符集用的ascii 码的范围也不一样,常用的汉字字符集有GB2312-80,GBK,Big5,unicode 等。下面我重点说一说最常用的GB_2312 的字符集。
GB_2312 字符集是目前最常用的汉字编码标准,windows 95/98/2000 中使用的 GBK字符集 就包含了GB2312,或者说和GB2312 兼容,GB_2312 字符集包含了 6763个的 简体汉字,和682 个标准中文符号。在这个标准中,每个汉字用2个字节来表示,每个字节的ascii码为 161-254 (16 进制A1 - FE),第一个字节 对应于 区码的1-94 区,第二个字节 对应于位码的1-94 位。
161-254 其实很好记忆,大家知道英文字符中,可打印的字符范围为33-126。将 这对 数加上128(或者说最高位置1),就得到汉字使用的字符的范围。
十进制代码 | 十六进制代码 | MCS 字符或缩写 | DEC 多国字符名 |
ASCII 控制字符 1 | |||
0 | 0 | NUL | 空字符 |
1 | 1 | SOH | 标题起始 (Ctrl/A) |
2 | 2 | STX | 文本起始 (Ctrl/B) |
3 | 3 | ETX | 文本结束 (Ctrl/C) |
4 | 4 | EOT | 传输结束 (Ctrl/D) |
5 | 5 | ENQ | 询问 (Ctrl/E) |
6 | 6 | ACK | 认可 (Ctrl/F) |
7 | 7 | BEL | 铃 (Ctrl/G) |
8 | 8 | BS | 退格 (Ctrl/H) |
9 | 9 | HT | 水平制表栏 (Ctrl/I) |
10 | 0A | LF | 换行 (Ctrl/J) |
11 | 0B | VT | 垂直制表栏 (Ctrl/K) |
12 | 0C | FF | 换页 (Ctrl/L) |
13 | 0D | CR | 回车 (Ctrl/M) |
14 | 0E | SO | 移出 (Ctrl/N) |
15 | 0F | SI | 移入 (Ctrl/O) |
16 | 10 | DLE | 数据链接丢失 (Ctrl/P) |
17 | 11 | DC1 | 设备控制 1 (Ctrl/Q) |
18 | 12 | DC2 | 设备控制 2 (Ctrl/R) |
19 | 13 | DC3 | 设备控制 3 (Ctrl/S) |
20 | 14 | DC4 | 设备控制 4 (Ctrl/T) |
21 | 15 | NAK | 否定接受 (Ctrl/U) |
22 | 16 | SYN | 同步闲置符 (Ctrl/V) |
23 | 17 | ETB | 传输块结束 (Ctrl/W) |
24 | 18 | CAN | 取消 (Ctrl/X) |
25 | 19 | EM | 媒体结束 (Ctrl/Y) |
26 | 1A | SUB | 替换 (Ctrl/Z) |
27 | 1B | ESC | 换码符 |
28 | 1C | FS | 文件分隔符 |
29 | 1D | GS | 组分隔符 |
30 | 1E | RS | 记录分隔符 |
31 | 1F | US | 单位分隔符 |
ASCII 特殊和数字字符 | |||
32 | 20 | SP | 空格 |
33 | 21 | ! | 感叹号 |
34 | 22 | " | 引号 (双引号) |
35 | 23 | # | 数字符号 |
36 | 24 | $ | 美元符 |
37 | 25 | % | 百分号 |
38 | 26 | & | 和号 |
39 | 27 | ' | 省略号 (单引号) |
40 | 28 | ( | 左圆括号 |
41 | 29 | ) | 右圆括号 |
42 | 2A | * | 星号 |
43 | 2B | + | 加号 |
44 | 2C | , | 逗号 |
45 | 2D | -- | 连字号或减号 |
46 | 2E | . | 句点或小数点 |
47 | 2F | / | 斜杠 |
48 | 30 | 0 | 零 |
49 | 31 | 1 | 1 |
50 | 32 | 2 | 2 |
51 | 33 | 3 | 3 |
52 | 34 | 4 | 4 |
53 | 35 | 5 | 5 |
54 | 36 | 6 | 6 |
55 | 37 | 7 | 7 |
56 | 38 | 8 | 8 |
57 | 39 | 9 | 9 |
58 | 3A | : | 冒号 |
59 | 3B | ; | 分号 |
60 | 3C | < | 小于 |
61 | 3D | = | 等于 |
62 | 3E | > | 大于 |
63 | 3F | ? | 问号 |
ASCII 字母字符 | |||
64 | 40 | @ | 商业 at 符号 |
65 | 41 | A | 大写字母 A |
66 | 42 | B | 大写字母 B |
67 | 43 | C | 大写字母 C |
68 | 44 | D | 大写字母 D |
69 | 45 | E | 大写字母 E |
70 | 46 | F | 大写字母 F |
71 | 47 | G | 大写字母 G |
72 | 48 | H | 大写字母 H |
73 | 49 | I | 大写字母 I |
74 | 4A | J | 大写字母 J |
75 | 4B | K | 大写字母 K |
76 | 4C | L | 大写字母 L |
77 | 4D | M | 大写字母 M |
78 | 4E | N | 大写字母 N |
79 | 4F | O | 大写字母 O |
80 | 50 | P | 大写字母 P |
81 | 51 | Q | 大写字母 Q |
82 | 52 | R | 大写字母 R |
83 | 53 | S | 大写字母 S |
84 | 54 | T | 大写字母 T |
85 | 55 | U | 大写字母 U |
86 | 56 | V | 大写字母 V |
87 | 57 | W | 大写字母 W |
88 | 58 | X | 大写字母 X |
89 | 59 | Y | 大写字母 Y |
90 | 5A | Z | 大写字母 Z |
91 | 5B | [ | 左中括号 |
92 | 5C | \ | 反斜杠 |
93 | 5D | ] | 右中括号 |
94 | 5E | ^ | 音调符号 |
95 | 5F | _ | 下划线 |
96 | 60 | ` | 重音符 |
97 | 61 | a | 小写字母 a |
98 | 62 | b | 小写字母 b |
99 | 63 | c | 小写字母 c |
100 | 64 | d | 小写字母 d |
101 | 65 | e | 小写字母 e |
102 | 66 | f | 小写字母 f |
103 | 67 | g | 小写字母 g |
104 | 68 | h | 小写字母 h |
105 | 69 | i | 小写字母 i |
106 | 6A | j | 小写字母 j |
107 | 6B | k | 小写字母 k |
108 | 6C | l | 小写字母 l |
109 | 6D | m | 小写字母 m |
110 | 6E | n | 小写字母 n |
111 | 6F | o | 小写字母 o |
112 | 70 | p | 小写字母 p |
113 | 71 | q | 小写字母 q |
114 | 72 | r | 小写字母 r |
115 | 73 | s | 小写字母 s |
116 | 74 | t | 小写字母 t |
117 | 75 | u | 小写字母 u |
118 | 76 | v | 小写字母 v |
119 | 77 | w | 小写字母 w |
120 | 78 | x | 小写字母 x |
121 | 79 | y | 小写字母 y |
122 | 7A | z | 小写字母 z |
123 | 7B | { | 左大括号 |
124 | 7C | | | 垂直线 |
125 | 7D | } | 右大括号 (ALTMODE) |
126 | 7E | ~ | 代字号 (ALTMODE) |
127 | 7F | DEL | 擦掉 (DELETE) |
控制字符 | |||
128 | 80 |
| [保留] |
129 | 81 |
| [保留] |
130 | 82 |
| [保留] |
131 | 83 |
| [保留] |
132 | 84 | IND | 索引 |
133 | 85 | NEL | 下一行 |
134 | 86 | SSA | 被选区域起始 |
135 | 87 | ESA | 被选区域结束 |
136 | 88 | HTS | 水平制表符集 |
137 | 89 | HTJ | 对齐的水平制表符集 |
138 | 8A | VTS | 垂直制表符集 |
139 | 8B | PLD | 部分行向下 |
140 | 8C | PLU | 部分行向上 |
141 | 8D | RI | 反向索引 |
142 | 8E | SS2 | 单移 2 |
143 | 8F | SS3 | 单移 3 |
144 | 90 | DCS | 设备控制字符串 |
145 | 91 | PU1 | 专用 1 |
146 | 92 | PU2 | 专用 2 |
147 | 93 | STS | 设置传输状态 |
148 | 94 | CCH | 取消字符 |
149 | 95 | MW | 消息等待 |
150 | 96 | SPA | 保护区起始 |
151 | 97 | EPA | 保护区结束 |
152 | 98 |
| [保留] |
153 | 99 |
| [保留] |
154 | 9A |
| [保留] |
155 | 9B | CSI | 控制序列引导符 |
156 | 9C | ST | 字符串终止符 |
157 | 9D | OSC | 操作系统命令 |
158 | 9E | PM | 秘密消息 |
159 | 9F | APC | 应用程序 |
其他字符 | |||
160 | A0 |
| [保留] 2 |
161 | A1 | ¡ | 反向感叹号 |
162 | A2 | ¢ | 分币符 |
163 | A3 | £ | 英磅符 |
164 | A4 |
| [保留] 2 |
165 | A5 | ¥ | 人民币符 |
166 | A6 |
| [保留] 2 |
167 | A7 | § | 章节符 |
168 | A8 | ¤ | 通用货币符号 2 |
169 | A9 | © | 版权符号 |
170 | AA | ª | 阴性顺序指示符 |
171 | AB | « | 左角引号 |
172 | AC |
| [保留] 2 |
173 | AD |
| [保留] 2 |
174 | AE |
| [保留] 2 |
175 | AF |
| [保留] 2 |
176 | B0 | ° | 温度符 |
177 | B1 | ± | 加/减号 |
178 | B2 | ² | 上标 2 |
179 | B3 | ³ | 上标 3 |
180 | B4 |
| [保留] 2 |
181 | B5 | µ | 微符 |
182 | B6 | ¶ | 段落符,pilcrow |
183 | B7 | · | 中点 |
184 | B8 |
| [保留] 2 |
185 | B9 | ¹ | 上标 1 |
186 | BA | º | 阳性顺序指示符 |
187 | BB | » | 右角引号 |
188 | BC | ¼ | 分数四分之一 |
189 | BD | ½ | 分数二分之一 |
190 | BE |
| [保留] 2 |
191 | BF | ¿ | 反向问号 |
192 | C0 | À | 带重音符的大写字母 A |
193 | C1 | Á | 带尖锐重音的大写字母 A |
194 | C2 | Â | 带音调符号的大写字母 A |
195 | C3 | Ã | 带代字号的大写字母 A |
196 | C4 | Ä | 带元音变音 (分音符号) 的大写字母 A |
197 | C5 | Å | 带铃声的大写字母 A |
198 | C6 | Æ | 大写字母 AE 双重元音 |
199 | C7 | Ç | 带变音符号的大写字母 C |
200 | C8 | È | 带重音符的大写字母 E |
201 | C9 | É | 带尖锐重音的大写字母 E |
202 | CA | Ê | 带音调符号的大写字母 E |
203 | CB | Ë | 带元音变音 (分音符号) 的大写字母 E |
204 | CC | Ì | 带重音符的大写字母 I |
205 | CD | Í | 带尖锐重音的大写字母 I |
206 | CE | Î | 带音调符号的大写字母 I |
207 | CF | Ï | 带元音变音 (分音符号) 的大写字母 I |
208 | D0 |
| [保留] 2 |
209 | D1 | Ñ | 带代字号的大写字母 N |
210 | D2 | Ò | 带重音符的大写字母 O |
211 | D3 | Ó | 带尖锐重音的大写字母 O |
212 | D4 | Ô | 带音调符号的大写字母 O |
213 | D5 | Õ | 带代字号的大写字母 O |
214 | D6 | Ö | 带元音变音 (分音符号) 的大写字母 O |
215 | D7 | OE | 大写字母 OE 连字 2 |
216 | D8 | Ø | 带斜杠的大写字母 O |
217 | D9 | Ù | 带重音符的大写字母 U |
218 | DA | Ú | 带尖锐重音的大写字母 U |
219 | DB | Û | 带音调符号的大写字母 U |
220 | DC | Ü | 带元音变音 (分音符号) 的大写字母 U |
221 | DD | Y | 带元音变音 (分音符号) 的大写字母 Y |
222 | DE |
| [保留] 2 |
223 | DF | ß | 德语高调小写字母 s |
224 | E0 | à | 带重音符的小写字母 a |
225 | E1 | á | 带尖锐重音的小写字母 a |
226 | E2 | â | 带音调符号的小写字母 a |
227 | E3 | ã | 带代字号的小写字母 a |
228 | E4 | ä | 带元音变音 (分音符号) 的小写字母 a |
229 | E5 | å | 带铃声的小写字母 a |
230 | E6 | æ | 小写字母 ae 双重元音 |
231 | E7 | ç | 带变音符号的小写字母 c |
232 | E8 | è | 带重音符的小写字母 e |
233 | E9 | é | 带尖锐重音的小写字母 e |
234 | EA | ê | 带音调符号的小写字母 e |
235 | EB | ë | 带元音变音 (分音符号) 的小写字母 e |
236 | EC | ì | 带重音符的小写字母 i |
237 | ED | í | 带尖锐重音的小写字母 i |
238 | EE | î | 带音调符号的小写字母 i |
239 | EF | ï | 带元音变音 (分音符号) 的小写字母 i |
240 | F0 |
| [保留] 2 |
241 | F1 | ñ | 带代字号的小写字母 n |
242 | F2 | ò | 带重音符的小写字母 o |
243 | F3 | ó | 带尖锐重音的小写字母 o |
244 | F4 | ô | 带音调符号的小写字母 o |
245 | F5 | õ | 带代字号的小写字母 o |
246 | F6 | ö | 带元音变音 (分音符号) 的小写字母 o |
247 | F7 | oe | 小写字母 oe 连字 2 |
248 | F8 | ø | 带斜杠的小写字母 o |
249 | F9 | ù | 带重音符的小写字母 u |
250 | FA | ú | 带尖锐重音的小写字母 u |
251 | FB | û | 带音调符号的小写字母 u |
252 | FC | ü | 带元音变音 (分音符号) 的小写字母 u |
253 | FD | ÿ | 带元音变音 (分音符号) 的小写字母 y 2 |
254 | FE |
| [保留] 2 |
255 | FF |
| [保留] 2 |
js unicode是以十六进制代码外加开头\\u表示的字符串。本文将讲解通过js实现unicode转化为汉字的方法,实现汉字转Unicode码。
中文汉字在utf-8中到底占几个字节,一般是3个字节,最常见的编码方式是1110xxxx 10xxxxxx 10xxxxxx。
关于换行和回车其实平时我们不太在意,所以关于两者的区别也不太清楚,在平时开发时可能会遇到一些文件处理的问题,放到不同的操作系统上出现各种坑。那么回车和换行到底有哪些区别呢?
escape(), encodeURI()和encodeURIComponent()是在Javascript中用于编码字符串的三个常用的方法,而他们之间的异同却困扰了很多的Javascript初学者,今天我就在这里对这三个方法详细地分析与比较一下。
js的string变量存储字符串使用的是unicode编码,要保存时必须选择其他编码后进行传输,比如转成utf-8,utf-32等。存储到数据库中为utf-8编码,可以正确支持中文、emoji表情、英文混合的字符串编码互转
很久很久以前,有一群人,他们决定用8个可以开合的晶体管来组合成不同的状态,以表示世界上的万物。他们看到8个开关状态是好的,于是他们把这称为”字节“。再后来,他们又做了一些可以处理这些字节的机器,机器开动了
因为当字符串数据以url的形式传递给web服务器时,字符串中是不允许出现空格和特殊字符的。也就是说,url的参数传递的时候,需要遵循一定的url规范才能正确的传送。通常如果一样东西需要编码,说明这样东西并不适合传输。
字符集 Charset :是一个系统支持的所有字符的集合,包括各国家文字、标点符号、图形符号、数字等。编码是信息从一种形式或格式转换为另一种形式的过程,也称为计算机编程语言的代码简称编码。
世界第一台计算机诞生了。计算机由硬件和系统软件组成,它最基本的功能就是存储、表示与处理信息。通俗地说,信息其实就是由各种各样的字符组成,比如英文字母、汉字以及其他国家的语言等。
1xx-信息提示:这些状态代码表示临时的响应。客户端在收到常规响应之前,应准备接收一个或多个1xx响应。2xx-成功:这类状态代码表明服务器成功地接受了客户端请求。
内容以共享、参考、研究为目的,不存在任何商业目的。其版权属原作者所有,如有侵权或违规,请与小编联系!情况属实本人将予以删除!