系统城装机大师 - 固镇县祥瑞电脑科技销售部宣传站!

当前位置:首页 > 数据库 > 其它 > 详细页面

关于关系数据库如何快速查询表的记录数详解

时间:2019-12-04来源:电脑系统城作者:电脑系统城

前言

在数据库中,很多人员习惯使用SELECT COUNT(*) 、SELECT COUNT(1) 、SELECT COUNT(COL)来查询一个表有多少记录,对于小表,这种SQL的开销倒不是很大,但是对于大表,这种查询表记录数的做法就是一个非常消耗资源了,而且效率很差。下面介绍一下SQL Server、 Oracle、MySQL中如何快速获取表的记录数。

SQL SERVER 数据库

在SQL Server数据库中, 对象目录视图sys.partitions中有一个字段rows会记录表的记录数。我们以AdventureWorks2014为测试数据库。


 
  1. SELECT OBJECT_NAME(object_id) AS Object_Name,
  2. i.name AS Index_Name,
  3. p.rows AS Table_Rows
  4. FROM sys.partitions p
  5. LEFT JOIN sys.sysindexes i ON p.object_id = i.id AND p.index_id = i.indid
  6. WHERE
  7. object_id = OBJECT_ID('TableName')

那么我们还有一些疑问,我们先来看看这些问题吧!

1:没有索引的表是否也可以使用上面脚本?

2:只有非聚集索引的堆表是否可以使用上面脚本?

3:有多个索引的表,是否记录数会存在不一致的情况?

4:统计信息不准确的表,是否rows也会不准确

5: 分区表的情况又是怎么样?

6:对象目录视图sys.partitions与sp_spaceused获取的表记录函数是否准确。

如下所示,我们先构造测试案例:


 
  1. IF EXISTS(SELECT 1 FROM sys.objects WHERE type='U' AND name='TEST_TAB_ROW')
  2. BEGIN
  3. DROP TABLE TEST_TAB_ROW;
  4. END
  5.  
  6. IF NOT EXISTS(SELECT 1 FROM sys.objects WHERE type='U' AND name='TEST_TAB_ROW')
  7. BEGIN
  8. CREATE TABLE TEST_TAB_ROW
  9. (
  10. ID INT,
  11. NAME CHAR(200)
  12. )
  13. END
  14. GO
  15.  
  16. SET NOCOUNT ON;
  17. BEGIN TRAN
  18. DECLARE @Index INT =1;
  19.  
  20. WHILE @Index <= 100000
  21. BEGIN
  22.  
  23. INSERT INTO TEST_TAB_ROW
  24. VALUES(@Index, NEWID());
  25.  
  26. SET @Index+=1;
  27.  
  28. IF (@Index % 5000) = 0
  29. BEGIN
  30. IF @@TRANCOUNT > 0
  31. BEGIN
  32. COMMIT;
  33. BEGIN TRAN
  34. END
  35. END
  36. END
  37.  
  38. IF @@TRANCOUNT > 0
  39. BEGIN
  40. COMMIT;
  41. END
  42. GO

关于问题1、问题2,都可以使用上面脚本, 如下测试所示:


 
  1. SELECT OBJECT_NAME(object_id) AS Object_Name,
  2. i.name AS Index_Name,
  3. p.rows AS Table_Rows
  4. FROM sys.partitions p
  5. LEFT JOIN sys.sysindexes i ON p.object_id = i.id AND p.index_id = i.indid
  6. WHERE
  7. object_id = OBJECT_ID('dbo.TEST_TAB_ROW')

在表dbo.TEST_TAB_ROW 上创建非聚集索引后,查询结果如下所示:


 
  1. CREATE INDEX IX_TEST_TAB_ROW ON TEST_TAB_ROW(ID);

我们插入500条记录,此时,这个数据量不足以触发统计信息更新,如下所示, Rows Sampled还是1000000


 
  1. DECLARE @Index INT =1;
  2.  
  3. WHILE @Index <= 500
  4. BEGIN
  5.  
  6. INSERT INTO TEST_TAB_ROW
  7. VALUES(100000 +@Index, NEWID());
  8.  
  9. SET @Index+=1;
  10.  
  11. END

如下所示,发现sys.partitions中的记录变成了100500了,可见rows这个值的计算不依赖统计信息。

当然,如果你用sp_spaceused,发现这里面的记录也是100500

sp_spaceused 'dbo.TEST_TAB_ROW'

关于问题3:有多个索引的表,是否记录数会存在不一致的情况?

答案:个人测试以及统计来看,暂时发现多个索引的情况下,sys.partitions中的rows记录数都是一致的。暂时没有发现不一致的情况,当然也不排除有特殊情况。

关于问题5: 分区表的情况又是怎么样?

答案:分区表和普通表没有任何区别。

关于问题6:对象目录视图sys.partitions与sp_spaceused获取的表记录函数是否准确?

答案:对象目录视图sys.partitions与sp_spaceused获取的表记录数是准确的。

ORACLE 数据库

在ORACLE数据库中,可以通过DBA_TABLES、ALL_TABLES、USER_TABLES视图查看表的记录数,不过这个值(NUM_ROWS)跟统计信息有很大的关系,有时候统计信息没有更新或采样比例会导致这个值不是很准确。


 
  1. SELECT OWNER ,
  2. TABLE_NAME,
  3. NUM_ROWS ,
  4. LAST_ANALYZED
  5. FROM DBA_TABLES
  6. WHERE OWNER = '&OWNER'
  7. AND TABLE_NAME = '&TABLE_NAME';
  8.  
  9.  
  10. SELECT OWNER,
  11. TABLE_NAME,
  12. NUM_ROWS ,
  13. LAST_ANALYZED
  14. FROM ALL_TABLES
  15. WHERE OWNER ='&OWNER'
  16. AND TABLE_NAME='&TABLE_NAME';
  17.  
  18.  
  19. SELECT TABLE_NAME,
  20. NUM_ROWS ,
  21. LAST_ANALYZED
  22. FROM USER_TABLES
  23. WHERE TABLE_NAME='&TABLE_NAME'

更新统计信息后,就能得到准确的行数。所以如果需要得到正确的数据,最好更新目标表的统计信息,进行100%采样分析。对于分区表,那么就需要从dba_tab_partitions里面查询相关数据了。

SQL>execute dbms_stats.gather_table_stats(ownname => 'username', tabname =>'tablename', estimate_percent =>100, cascade=>true);

MySQL数据库

在MySQL中比较特殊,虽然INFORMATION_SCHEMA.TABLES也可以查到表的记录数,但是非常不准确。如下所示,即使使用ANALYZE TABLE更新了统计信息,从INFORMATION_SCHEMA.TABLES中获取的记录依然不准确


 
  1. SELECT TABLE_ROWS
  2. FROM INFORMATION_SCHEMA.TABLES
  3. WHERE TABLE_NAME='table_name'

 
  1. mysql> SELECT TABLE_ROWS
  2. -> FROM INFORMATION_SCHEMA.TABLES
  3. -> WHERE TABLE_NAME='jiraissue'
  4. -> ;
  5. +------------+
  6. | TABLE_ROWS |
  7. +------------+
  8. | 36487 |
  9. +------------+
  10. 1 row in set (0.01 sec)
  11.  
  12. mysql> select count(*) from jiraissue;
  13. +----------+
  14. | count(*) |
  15. +----------+
  16. | 36973 |
  17. +----------+
  18. 1 row in set (0.05 sec)
  19.  
  20. mysql> analyze table jiraissue;
  21. +----------------+---------+----------+----------+
  22. | Table | Op | Msg_type | Msg_text |
  23. +----------------+---------+----------+----------+
  24. | jira.jiraissue | analyze | status | OK |
  25. +----------------+---------+----------+----------+
  26. 1 row in set (1.41 sec)
  27.  
  28. mysql> SELECT TABLE_ROWS
  29. -> FROM INFORMATION_SCHEMA.TABLES
  30. -> WHERE TABLE_NAME='jiraissue';
  31. +------------+
  32. | TABLE_ROWS |
  33. +------------+
  34. | 34193 |
  35. +------------+
  36. 1 row in set (0.00 sec)
  37.  
  38. mysql>

如上所示,MySQL这种查询表记录数的方法看来还是有缺陷的。当然如果不是要求非常精确的值,这个方法也是不错的。

当然,上面介绍的SQL Server、Oracle、MySQL数据库中的方法,还是有一些局限性的。例如,只能查询整张表的记录数,对于那些查询记录数带有查询条件(WHERE)这类SQL。还是必须使用SELECT COUNT(*)这种方法。

总结

分享到:

相关信息

系统教程栏目

栏目热门教程

人气教程排行

站长推荐

热门系统下载