MySQL 字符集、排序规则与查询关系最佳实践_数据库_开发者

一、常见排序规则

排序规则	对应字符集	大小写敏感	重音敏感	适用版本	说明
utf8_general_ci	utf8	❌	❌	所有版本	基本 Unicode 比较
utf8mb4_general_ci	utf8mb4	❌	❌	5.5.3+	默认的 utf8mb4 排序规则
latin1_swedish_ci	latin1	❌	❌	所有版本	传统西欧默认排序规则
utf8mb4_unicode_ci	utf8mb4	❌	✅	5.5.3+	符合 Unicode 标准的更准确排序
utf8mb4_0900_ai_ci	utf8mb4	❌	❌	8.0+	基于 Unicode 9.0 标准
utf8_bin	utf8	✅	✅	所有版本	二进制比较（严格区分大小写）
utf8mb4_bin	utf8mb4	✅	✅	5.5.3+	utf8mb4 的二进制比较
utf8mb4_unicode_cs	utf8mb4	✅	✅	5.5.3+	已弃用，改用 utf8mb4_bin
utf8mb4_0900_as_cs	utf8mb4	✅	✅	8.0+	严格区分大小写和重音

表格说明：

（1）可通过排序规则后缀判断其是否支持大小写和重音敏感，ci、cs、ai、as 分别表示不区分大小写、区分大小写、不区分重音和区分重音。

（2）带 bin 后缀的排序规则基于二进制（Binary）比较，严格区分和重音。

二、设置方法

1. 数据库实例级

# my.conf 或 my.ini
[mysqld]
character-set-server=utf8mb4
collation-server=utf8mb4_general_ci

2. 数据库级

CREATE DATABASE javascriptmydb 
  CHARACTER SET utf8mb4 
  COLLATE utf8mb4_general_ci;

3. 表级

CREATE TABLE case_sensitive_table (
    id INT,
    username VARCHAR(50)
) CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci;

4. 列级

CREATE TABLE case_sensitive_table (
    id INT,
    username VARCHAR(50) CHARACTER SET utf8mb4 COLLATE utf8mb4_bin
) CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci;

三、设置建议

1. 注意事项

（1）性能影响：使用区分大小写的比较可能会影响查询性能，混合使用不同字符集也可能影响查询优化

（2）存储空间：不同字符集占用的存储空间不同 (如 utf8mb4 比 latin1 占用更多空间)

（3）索引限制：某些情况下不同字符集的列不能直接比较或连接

（4）转换风险：修改已有数据的字符集前需谨慎，可能导致数据丢失或损坏

2. 最佳实践

（1）尽量保持各表及表内各列字符集和排序规则一致，除非有特殊需求

（2）修改已有数据的字符集前先备份数据

（3）对于需要区分大小写的列 (如用户名、验证码)，明确指定使用_bin排序规则

（4javascript）应文档化说明使用不同字符集/排序规则的原因

（5）MySQL 8.0 默认使用 utf8mb4 + utf8mb4_0900_ai_ci，它符合更新的 Unicode 标准且性能更优

四、查看方法

## 查看数据库字符集和排序规则
SHOW VARIABLES LIKE 'character_set_server';
SHOW VARIABLES LIKE 'collation_server';
## 查看某表字符集和序规则
SHOW CREATE TABLE `table_name`; # CHARSET 后面为字符集
SHOW TABLE STATUS LIKE 'table_name'; # Collation 列表示排序规则

五、查询时如何强制区分大小写

1. 强制方法

如遇到不支持区分大小写的排序规则，可使用以下方法强制启用：

（1）使用 COLLATE 指定区分大小写的排序规则

SELECT * FROM table_name WHERE column_name COLLATE utf8mb4_bin = 'Value'; -- utf8mb4_bihttp://www.devze.comn 需适配字符集

（2）使用 BINARY 运算符

SELECT * FROM table_name WHERE BINARY column_name = 'Value';

（3）使用 LIKE BINARY 语法

SELECT * FROM table_name WHERE column_name LIKE BINARY 'Value';

（4）使用区分大小写的函数

SELECT * FROM table_name WHERE CAST(column_name AS BINARY) = CAST('Value' AS BINARY);

（5）修改列或表的字符集排序规则

-- 修改列的排序规则
ALTER TABLE table_name MODIFY column_name VARCHAR(255) COLLATE utf8mb4_bin;
-- 修改表的默认排序规则
ALTER TABLE table编程_name COLLATE utf8mb4_bin;

2. 各方法对比

方法	是否利用索引	持久性	字符集兼容性	推荐场景	缺点
使用 COLLATE 指定区分大小写的排序规则	✅ 是	仅当前查询	需匹配列字符集	临时区分大小写查询	需显式指定，字符集需一致
使用 BINARY 运算符	⚠️ 部分场景	仅当前查询	任意字符集	快速兼容性写法	某些版本无法利用索引
使用 LIKE BINARY 语法	⚠️ 部分场景	仅当前查询	任意字符集	不推荐（语义混淆）	性能差，模糊匹配语义不清晰
使用区分大小写的函数	⚠️ 部分场景	仅当前查询	任意字符集	极特殊场景	性能最差，语法冗长
修改列或表的字符集排序规则	✅ 是	✅ 永久生效	需匹配列字符集	需要长期区分大小写的字段	修改表结构可能锁表

3. 使用建议

如仅当前查询需区分大小写，建议使用 COLLATE 指定区分大小写的排序规则；如需永久生效，建议修改列或表的字符集排序规则。

到此这篇关于MySQL 字符集、排序规则与查询关系详解的文章就介绍到这了,更多相关MySQL 字符集、排序规则与查询内容请搜索编程客栈(www.devze.com)以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程客栈(www.devze.com)！

MySQL 字符集、排序规则与查询关系最佳实践

目录

一、常见排序规则

二、设置方法

1. 数据库实例级

2. 数据库级

3. 表级

4. 列级

三、设置建议

1. 注意事项

2. 最佳实践

四、查看方法

五、查询时如何强制区分大小写

1. 强制方法

2. 各方法对比

3. 使用建议

精彩评论

关注公众号

热门标签

图文推荐

MySQL 字符集、排序规则与查询关系最佳实践

目录

一、常见排序规则

二、设置方法

1. 数据库实例级

2. 数据库级

3. 表级

4. 列级

三、设置建议

1. 注意事项

2. 最佳实践

四、查看方法

五、查询时如何强制区分大小写

1. 强制方法

2. 各方法对比

3. 使用建议

更多 数据库 相关资讯：

精彩评论

关注公众号

热门标签

图文推荐

更多数据库相关资讯：