Chinese 汉字中文的编码范围介绍 - 文章教程

Chinese 汉字中文的编码范围介绍

发布于 2018-03-03 字数 1440 浏览 3235 评论 0

编码是用预先规定的方法将文字、数字或其他对象编成数码,或将信息、数据转换成规定的电脉冲信号。编码在电子计算机、电视、遥控和通讯等方面广泛使用。编码是信息从一种形式或格式转换为另一种形式的过程。解码是编码的逆过程。

PHP 实现 URL 转码相关方法介绍

以固定的顺序排列字符,并以此做为记录、存贮、传递、交换的统一内部特征,这个字符排列顺序被称为编码。和中文字库有关的编码标准有:国标 GB 码、GBK 码、港台 BIG-5 码等,不同编码的汉字字库都与汉字的应用有密切关系。

如何使用

在定义 CSS 的时候,定义中文字体 微软雅黑 就可以使用 \5FAE\8F6F\96C5\9ED1

font:12px/1.6 \5FAE\8F6F\96C5\9ED1

汉字编码范围

GBK(GB2312/GB18030)

GBK是采用单双字节变长编码,英文使用单字节编码,完全兼容ASCII字符编码,中文部分采用双字节编码。

\x00-\xff GBK 双字节编码范围
\x20-\x7f ASCII
\xa1-\xff 中文 gb2312
\x80-\xff 中文 gbk

UTF-8(Unicode)

UTF-8 是一种针对 Unicode 的可变长度字符编码,又称万国码。由 Ken Thompson 于 1992 年创建。现在已经标准化为 RFC 3629。UTF-8 用 1 到 6 个字节编码 Unicode 字符。用在网页上可以统一页面显示中文简体繁体及其它语言。

\u4e00-\u9fa5 (中文)
\x3130-\x318F (韩文
\xAC00-\xD7A3 (韩文)
\u0800-\u4e00 (日文)

如果你对这篇文章有疑问,欢迎到本站 社区 发帖提问或使用手Q扫描下方二维码加群参与讨论,获取更多帮助。

扫码加入群聊

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

目前还没有任何评论,快来抢沙发吧!

关于作者

JSmiles

生命进入颠沛而奔忙的本质状态,并将以不断告别和相遇的陈旧方式继续下去。

2891 文章
评论
84935 人气
更多

推荐作者

勿忘心安

文章 0 评论

ekko

文章 0 评论

江挽川

文章 0 评论

献世佛

文章 0 评论

Meets

文章 0 评论