锋盈数科-知识库 Logo
首页
软件开发
计算机基础
Hello Halo
新手必读
关于本知识库
登录 →
锋盈数科-知识库 Logo
首页 软件开发 计算机基础 Hello Halo 新手必读 关于本知识库
登录
  1. 首页
  2. 软件开发
  3. 字符集和编码格式

字符集和编码格式

0
  • 软件开发
  • 发布于 2024-09-20
  • 0 次阅读
黄健
黄健

1. 字符集(Character Set):

字符集是一个定义了所有可能字符的集合。字符集决定了可以表示的字符种类,比如字母、数字、符号和控制字符。

举例:

  • ASCII 是一种字符集,它包含 128 个字符,主要包括英文字母(A-Z, a-z)、数字(0-9)以及一些常见的符号和控制字符(如换行符、回车符等)。
  • Unicode 是一个更大的字符集,它可以表示世界上几乎所有语言中的字符,包含了数百万个字符。

常见字符集:

  • ASCII:美国信息交换标准代码(只能表示 128 个字符)。
  • ISO-8859-1(Latin-1):支持西欧语言的字符集。
  • Unicode:可以表示所有语言的字符,包括中文、日文、韩文、阿拉伯文等。

2. 编码格式(Character Encoding):

编码格式是将字符集中的字符转换为二进制表示的方法。字符集定义了要表示哪些字符,而编码格式决定了如何在计算机中存储这些字符。

由于计算机只能处理二进制数据(0 和 1),字符集中的字符必须被转换为字节序列,这就是编码格式的作用。

举例:

  • 在 ASCII 编码 中,字母 'A' 的编码是 65(十进制),即 01000001(二进制)。
  • 在 UTF-8 编码 中,字母 'A' 也是 01000001,但对于中文字符 '你',其编码是两个字节:11100100 10111000 10101101。
  • UTF-16 编码会使用两个或更多字节来表示字符,尤其是对于非拉丁字符(如汉字)。

常见编码格式:

  • UTF-8:一种常用的 Unicode 编码格式,使用 1 到 4 个字节表示字符,广泛用于互联网和现代应用。
  • UTF-16:一种 Unicode 编码格式,通常使用 2 个或 4 个字节表示字符。
  • GBK:一种用于简体中文的编码格式,主要在中国大陆使用。

3. 字符集和编码格式的关系:

  • 字符集定义了字符的集合,比如 Unicode 定义了"你"这个字符。
  • 编码格式则是将字符转换为二进制的具体方法。比如在 UTF-8 中,“你"会被编码为 11100100 10111000 10101101,而在 UTF-16 中它可能是 01001111 01100000。

4. 常见问题:字符集与编码格式不匹配:

当一个程序尝试用错误的编码格式读取文本文件时,字符会被错误地解析,显示乱码,或者抛出异常(如 MalformedInputException)。这是因为程序读取的字节序列无法正确映射到字符集中定义的字符。

例子:

  • 文件是 GBK 编码,但程序用 UTF-8 读取,可能会出现乱码或读取错误。
  • 字符集 定义了可以使用哪些字符。
  • 编码格式 决定了如何将这些字符转换为计算机可理解的二进制格式。

原文链接: https://blog.csdn.net/m0_73837751/article/details/142335096

标签: #软件开发 1171
相关文章

万字:支付“核心系统”详解 2024-11-02 15:33

专栏作者:隐墨星辰 \| 主编:陈天宇宙 这篇文章也尝试化繁为简,探寻支付系统的本质,讲清楚在线支付系统最核心的一些概念和设计理念。 虽然支付行业已经过了风头最劲的时光,但跨境支付仍然在蓬勃发展,每年依然有很多新人进入这个行业,这篇文章尝试为这些刚入行的新人提供一点帮助。 文章只介绍一些支付行业十几

资深支付架构师视角:实战从问题定义到代码落地的完整套路 2024-11-02 15:33

前言 今天从一个实际案例入手,介绍站在架构师的角度,如何识别并定义问题,提炼需求,技术方案选型,再到详细设计,最后利用AI的能力协助写出核心的代码,验证与调优。 解决问题存在一定的模式,也可以称之为框架,总结出自己的思考和解题框架,以后再碰到同类型的问题就可以如庖丁解牛一样容易。 很多年前,我写代码

Spring 实现 3 种异步接口 2024-10-18 09:07

大家好,我是苏三~ 如何处理比较耗时的接口? 这题我熟,直接上异步接口,使用 Callable、WebAsyncTask 和 DeferredResult、CompletableFuture等均可实现。 但这些方法有局限性,处理结果仅返回单个值。在某些场景下,如果需要接口异步处理的同时,还持续不断地

重学SpringBoot3-集成Redis(五)之布隆过滤器 2024-10-08 11:24

更多SpringBoot3内容请关注我的专栏:《SpringBoot3》 期待您的点赞👍收藏⭐评论✍ 重学SpringBoot3-集成Redis(五)之布隆过滤器 1. 什么是布隆过滤器? * 基本概念 适用场景 2. 使用 Redis 实现布隆过滤器 * 项目依赖 Redis 配置

设计模式第16讲——迭代器模式(Iterator) 2024-10-08 11:24

一、什么是迭代器模式 迭代器模式是一种行为型设计模式,它提供了一种统一的方式来访问集合对象中的元素,而不是暴露集合内部的表示方式。简单地说,就是将遍历集合的责任封装到一个单独的对象中,我们可以按照特定的方式访问集合中的元素。 二、角色组成 抽象迭代器(Iterator):定义了遍历聚合对象所需的方法

vue2路由和vue3路由区别及原理 2024-10-08 11:24

一、Vue2 与 Vue3 路由的区别 1. 创建路由实例方式的不同 Vue 2 中,通过 Vue.use() 注册路由插件,并通过 new VueRouter() 来创建路由实例。 import Vue from 'vue';import VueRouter from 'vue-router';i

目录

IT 外包服务商

  • 意见投递
  • zyf6619

软件开发应用

主菜单

  • 首页
  • 软件开发
  • 计算机基础
  • Hello Halo
  • 新手必读
  • 关于本知识库
Copyright © 2024 your company All Rights Reserved. Powered by Halo.