mysql统计行数时到底应该怎么count

更新日期: 2019-04-15阅读: 2.1k标签: mysql

相信每个人在写代码时都有遇到过要获取MYSQL表里数据行数的情况,多数人获取数据表行数时都用COUNT(*),但同时也流传了不少其他方式,比如说COUNT(1)、COUNT(主键)、COUNT(字段)。到底哪种方式MYSQL执行起来更快也是众说纷纭,其实之前我也不知道到底哪个执行起来快,到底谁说的对(笑哭)。好在最近在认真学习极客时间的MySQL专栏,其中专门有一节是对这个问题的讨论,看完后也是解除了长久以来的疑惑。

文章中都是针对MySQL的InnoDB引擎展开讨论的,MyISAM引擎是把一个表的总行数记录在了磁盘里,查询时效率很高(如果加了where条件也不能直接从磁盘返回)。而InnoDB由于多版本并发控制(MVCC)的原因,即使时同一时刻的查询InnoDB表应该"返回多少行"也是不确定的,比如假设表t中有10000行数据:

时刻会话A会话B会话C
T1begin;
T2select count(*) from t;
T3insert into t (插入一行);
T4begin;
T5insert into t (插入一行);
T6select count(*) from t; (返回10000)select count(*) from t; (返回10002);select count(*) from t; (返回10001)

会话A在T1开启事务拿到一致性视图,可重复读级别下在事务中任何时刻读到数据都一样,其他事务的更新对会话A没影响所以count(*)的结果是10000,会话B在T4开启事务拿到一致性视图,T4之前会话C已经新插入了一条语句并提交(单独执行一条更新语句,InnoDB会自己启动一个事务,语句执行完马上提交)。会话B在T5插入一条新数据,在T6查询时count(*)的结果是10002(T4 begin时会话C insert语句已经提交,所以在会话B的事务中能看到这个更新)。由于会话B在T6时事务还没有提交,会话C看不到会话B的更新,所以会话C在T6时count(*)的结果是10001。

COUNT是一个聚合函数,它的功能是对返回的结果集中每一行进行判断,如果COUNT函数的参数不是NULL则累加1,否则不累加,最后返回累计值。接下来看一下每个COUNT版本的执行效率:

  • COUNT(主键ID) InnoDB遍历全表,把每一行的主键值都取出来返回给MySQL的Server层,因为主键不可能为NULL,Server层直接按行累加最后返回累计值给客户端。
  • COUNT(1) 遍历全表但不取值,Server层对返回的每一行放个数字"1"进去,按行累加。COUNT(1)比COUNT(主键)快,因为不需要取值,减少了数据传输。
  • COUNT(字段) 遍历全表,一行行从记录中读出字段值给Server层,Server层判断值不为NULL了再累加。
  • COUNT(*) MySQL专门做了优化,会找到表中最小的索引树,InnoDB普通索引树比主键索引小很多,对于COUNT(*)遍历哪个树是一样的,count(*)时MySQL不取记录值,count(*)也肯定不为NULL,Server层中直接按行累加。

所以这个版本COUNT的从低到高分别为:

COUNT(字段) < COUNT(主键) < COUNT(1) ≈ COUNT(*)

所以建议你尽量使用count(*)来获取记录行数。

另外要注意,很多人为了销量会把表的行数记录到Redis中,但这样不能保证Redis里的计数和MySQL表里的数据保持精确一致,这是两个不同的存储系统不支持分布式事务所以就无法拿到精确的一致性视图,如果为了效率把表行数单独存储那么最好存放在一个单独的MySQL表里,这样无法拿到一致性视图的问题就能解决了。

来自:https://segmentfault.com/a/1190000018865406

链接: https://fly63.com/article/detial/2881

node如何和MySQL进行通信

Node.js与MySQL交互操作有很多库,常用最多的是mysql模块,mysql数注意:安装前先把目录cd到node.exe所在目录下,这样执行安装命令时,这篇文章主要介绍:链接mysql的流程、数据库连接参数说明、MYSQL CURD操作、连接池Pooling connections、断线重连、防止SQL注入

MySQL 常用30种SQL查询语句优化方法

MySQL查询语句优化方法:应尽量避免在 where 子句中使用!=或<>操作符,否则将引擎放弃使用索引而进行全表扫描。对查询进行优化,应尽量避免全表扫描,首先应考虑在 where 及 order by 涉及的列上建立索引。

一个案例彻底弄懂如何正确使用 mysql inndb 联合索引

有一个业务是查询最新审核的5条数据,查看当时的监控情况 cpu 使用率是超过了100%,show processlist看到很多类似的查询都是处于create sort index的状态。索引有一个audit_time在左边的联合索引,没有关于status的索引。

mysql数据库使用insert语句插入中文数据报错

在mysql的命令行模式中,通过insert语句插入中文数据的时候报错,类似于下面这样,造成这个错误通常是由于创建数据表的时候使用了不正确的编码格式,可以使用如下命令查看操作的目标数据表的编码格式。

MySQL技术内幕:InnoDB存储引擎

本文绝大部分内容来源《MySQL技术内幕:InnoDB存储引擎》一书。InnoDB存储引擎是多线程模型,其后台有多个不同的后台线程,负责处理不同的任务。

MYSQL中视图的使用

什么是视图?执行一条SQL,将结果集保存在一张虚拟表中。在视图创建后,可以用与表基本相同的方式使用(查询、过滤、排序数据、与其他视图或连结、(添加、更新))视图只是用来查看存储在别处的数据的设施,本身不包含数据,返回的数据也是从其他表检索出来的。

Mysql常用函数

MySQL数据库中提供了很丰富的函数。MySQL函数包括数学函数、字符串函数、日期和时间函数、条件判断函数、系统信息函数、加密函数、格式化函数等。

mysql innodb索引原理

innodb存储引擎表是索引组织表,表中数据按照主键顺序存放。其聚集索引就是按照每张表的主键顺序构造一颗B+树,其叶子结点中存放的就是整张表的行记录数据,这些叶子节点成为数据页。

一条sql语句在mysql中是如何执行的

最近开始在学习mysql相关知识,自己根据学到的知识点,根据自己的理解整理分享出来,本篇文章会分析下一个sql语句在mysql中的执行流程,包括sql的查询在mysql内部会怎么流转,sql语句的更新是怎么完成的。

MySQL有哪些索引类型?

从数据结构角度B+树索引(O(log(n)));hash索引;FULLTEXT索引(现在MyISAM和InnoDB引擎都支持了);R-Tree索引(用于对GIS数据类型创建SPATIAL索引)

点击更多...

内容以共享、参考、研究为目的,不存在任何商业目的。其版权属原作者所有,如有侵权或违规,请与小编联系!情况属实本人将予以删除!