ROW_NUMBER() OVER函数的基本用法用法

语法:ROW_NUMBER() OVER(PARTITION BY COLUMN ORDER BY COLUMN) 简单的说row_number()从1开始,为每一条分组记录返回一个数字,这里的ROW_NUMBER() OVER (ORDER BY xlh DESC) 是先把xlh列降序,再为降序以后的没条xlh记录返回一个序号。 示例: xlh           row_num 1700              1 1500              2 1085              3 710                4 row_number() OVER (PARTITION BY COL1 ORDER BY COL2) 表示根据COL1分组,在分组内部根据 COL2排序,而此函数计算的值就表示每组内部排序后的顺序编号(组内连续的唯一的) 实例: 初始化数据 create table employee (empid int ,deptid int ,salary decimal(10,2)) insert into employee values(1,10,5500.00) insert into employee values(2,10,4500.00) insert into employee values(3,20,1900.00) insert into employee values(4,20,4800.00) insert into employee values(5,40,6500.00) insert into employee values(6,40,14500.00) insert into employee values(7,40,44500.00) insert into employee values(8,50,6500.00) insert into employee values(9,50,7500.00) 数据显示为 empid       deptid      salary ———-- ———-- ————————————— 1           10          5500.00 2           10          4500.00 3           20          1900.00 4           20          4800.00 5           40          6500.00 6           40          14500.00 7           40          44500.00 8           50          6500.00 9           50          7500.00 需求:根据部门分组,显示每个部门的工资等级 预期结果: empid       deptid      salary                                  rank ———-- ———-- ————————————— ——————-- 1           10          5500.00                                 1 2           10          4500.00                                 2 4           20          4800.00                                 1 3           20          1900.00                                 2 7           40          44500.00                               1 6           40          14500.00                               2 5           40          6500.00                                 3 9           50          7500.00                                 1 8           50          6500.00                                 2 SQL脚本: SELECT *, Row_Number() OVER (partition by deptid ORDER BY salary desc) rank FROM employee   转自:http://www.cnblogs.com/digjim/archive/2006/09/20/509344.html 我们知道,SQL Server 2005和SQL Server 2000 相比较,SQL Server 2005有很多新特性。这篇文章我们要讨论其中的一个新函数Row_Number()。数据库管理员和开发者已经期待这个函数很久了,现在终于等到了! 通常,开发者和管理员在一个查询里,用临时表和列相关的子查询来计算产生行号。现在SQL Server 2005提供了一个函数,代替所有多余的代码来产生行号。 我们假设有一个资料库[EMPLOYEETEST],资料库中有一个表[EMPLOYEE],你可以用下面的脚本来产生资料库,表和对应的数据。 USE [MASTER] GO

IF  EXISTS SELECT * FROM SYS.OBJECTS HERE OBJECT_ID = OBJECT_ID(N'[DBO].[EMPLOYEE]') AND TYPE IN (N’U')) DROP TABLE [DBO].[EMPLOYEE] GO

我们可以用下面的脚本查询EMPLOYEE表。 SELECT EMPID, RNAME, LNAME FROM EMPLOYEE 这个查询的结果应该如图1.0 2021110 MICHAEL POLAND 2021110 MICHAEL POLAND 2021115 JIM KENNEDY 2121000 JAMES SMITH 2011111 ADAM ACKERMAN 3015670 MARTHA LEDERER 1021710 MARIAH MANDEZ 图1.0  在SQL Server 2005,要根据这个表中的数据产生行号,我通常使用下面的查询。 SELECT ROWID=IDENTITY(int,1,1) , EMPID, FNAME, LNAME INTO EMPLOYEE2 FROM EMPLOYEE ORDER BY EMPID 这个查询创建了一个新的表,用identify函数来产生行号。我们用下面的查询来看看这个表的数据。

上面的查询结果如图1.1 1 1021710 MARIAH MANDEZ 2 2011111 ADAM ACKERMAN 3 2021110 MICHAEL POLAND 4 2021110 MICHAEL POLAND 5 2021115 JIM KENNEDY 6 2121000 JAMES SMITH 7 3015670 MARTHA LEDERER 图1.1  这个查询结果很明显EMP=2021110的行是重复的数据。 要删除EMPID=2021110的重复数据,我们必须在EMPLOYEE2表中删除,不能直接在EMPLOYEE中删除。 SQL Server 2005提供了一个新的函数(Row_Number())来产生行号。我们可以使用这个新函数来删除原来表中的重复数据,只用通常的表达方式再加上Row_Number()函数。 让我们用Row_Number()函数根据EMPID来产生ROWID。 SELECT ROW_NUMBER() OVER (ORDER BY EMPID ASC) AS ROWID, * FROM EMPLOYEE 上面的查询结果如图1.2 1 1021710 MARIAH MANDEZ 2 2011111 ADAM ACKERMAN 3 2021110 MICHAEL POLAND 4 2021110 MICHAEL POLAND 5 2021115 JIM KENNEDY 6 2121000 JAMES SMITH 7 3015670 MARTHA LEDERER 图1.2  在这个结果中,我们可以区别EMPID是2021110的重复数据。 我们可以用通用表查询表达式和Row_Numner()函数来选出重复的那行数据。 WITH [EMPLOYEE ORDERED BY ROWID] AS (SELECT ROW_NUMBER() OVER (ORDER BY EMPID ASC) AS ROWID, * FROM EMPLOYEE) SELECT * FROM [EMPLOYEE ORDERED BY ROWID] WHERE ROWID =4 上面的查询结果如图1.3 4 2021110 MICHAEL POLAND 图1.3  这一行重复的数据可以用下面这个通用表和Row_Number()函数来删除。 WITH [EMPLOYEE ORDERED BY ROWID] AS (SELECT ROW_NUMBER() OVER (ORDER BY EMPID ASC) AS ROWID, * FROM EMPLOYEE) DELETE FROM [EMPLOYEE ORDERED BY ROWID] WHERE ROWID =4 删除以后,我们可以用下面的查询语句看一下结果。 SELECT * FROM EMPLOYEE 这个查询结果如图1.4 2021110 MICHAEL POLAND 2021115 JIM KENNEDY 2121000 JAMES SMITH 2011111 ADAM ACKERMAN 3015670 MARTHA LEDERER 1021710 MARIAH MANDEZ 图 1.4  这里我们可以看到,重复的数据已经被删除了。 总结 在这篇文章中,我们讨论了SQL Server 2005 的新特性Row_Number()函数,还有通常的表表达式,然后如何使用这两个来删除重复的行。   转自:http://www.cnblogs.com/fxgachiever/archive/2010/09/15/1826792.html

存储过程中执行动态Sql语句

MSSQL为我们提供了两种动态执行SQL语句的命令,分别是EXEC和sp_executesql;通常,sp_executesql则更具有优势,它提供了输入输出接口,而EXEC没有。还有一个最大的好处就是利用sp_executesql,能够重用执行计划,这就大大提供了执行性能,还可以编写更安全的代码。EXEC在某些情况下会更灵活。除非您有令人信服的理由使用EXEC,否侧尽量使用sp_executesql. 1.EXEC的使用 EXEC命令有两种用法,一种是执行一个存储过程,另一种是执行一个动态的批处理。以下所讲的都是第二种用法。 下面先使用EXEC演示一个例子,代码1   代码 DECLARE @TableName VARCHAR(50),@Sql NVARCHAR (MAX),@OrderID INT; SET @TableName = 'Orders'; SET @OrderID = 10251; SET @sql =      ’SELECT * FROM '+QUOTENAME(@TableName) +’WHERE OrderID = '+      CAST(@OrderID AS VARCHAR(10))+' ORDER BY ORDERID DESC' EXEC(@sql);   注:这里的EXEC括号中只允许包含一个字符串变量,但是可以串联多个变量,如果我们这样写EXEC: EXEC('SELECT TOP('+ CAST(@TopCount AS VARCHAR(10)) +')* FROM '+            QUOTENAME(@TableName) +' ORDER BY ORDERID DESC');   SQL编译器就会报错,编译不通过,而如果我们这样:

  编译器就会通过; 所以最佳的做法是把代码构造到一个变量中,然后再把该变量作为EXEC命令的输入参数,这样就不会受限制了。 EXEC的缺点是不提供接口,这里的接口是指,它不能执行一个包含一个带变量符的批处理,如下 代码 DECLARE @TableName VARCHAR(50),@Sql NVARCHAR(MAX),@OrderID INT; SET @TableName = 'Orders'; SET @OrderID = 10251; SET @sql = 'SELECT * FROM '+QUOTENAME(@TableName) +      ’WHERE OrderID = @OrderID ORDER BY ORDERID DESC' EXEC(@sql); 关键就在SET @sql这一句话中,如果我们运行这个批处理,编译器就会产生一下错误 Msg 137, Level 15, State 2, Line 1 必须声明标量变量 "@OrderID"。 使用EXEC时,如果您想访问变量,必须把变量内容串联到动态构建的代码字符串中,如: SET @sql = 'SELECT * FROM '+QUOTENAME(@TableName) +    ’WHERE OrderID = '+CAST(@OrderID AS VARCHAR(10))+' ORDER BY ORDERID DESC'   串联变量的内容也存在性能方面的弊端。SQL Server为每一个的查询字符串创建新的执行计划,即使查询模式相同也是这样。为演示这一点,先清空缓存中的执行计划 DBCC FREEPROCCACHE (这个不是本文所涉及的内容,您可以查看MS的MSDN) 将代码1运行3次,分别对@OrderID 赋予下面3个值,10251,10252,10253。然后使用下面的代码查询  

  点击F5运行,我们可以看到,每执行一次都要产生一次的编译,执行计划没有得到充分重用。 EXEC除了不支持动态批处理中的输入参数外,他也不支持输出参数。默认情况下,EXEC把查询的输出返回给调用者。例如下面代码返回Orders表中所有的记录数  

然而,如果你要把输出返回给调用批处理中的变量,事情就没有那么简单了。为此,你必须使用INSERT EXEC语法把输出插入到一个目标表中,然后从这表中获取值后赋给该变量,就像这样: 代码

  2.sp_executesql的使用 sp_executesql命令在SQL Server中引入的比EXEC命令晚一些,它主要为重用执行计划提供更好的支持。 为了和EXEC作一个鲜明的对比,我们看看如果用代码1的代码,把EXEC换成sp_executesql,看看是否得到我们所期望的结果   代码

    注意最后一行;事实证明可以运行; sp_executesql提供接口 sp_executesql命令比EXEC命令更灵活,因为它提供一个接口,该接口及支持输入参数也支持输出参数。这功能使你可以创建带参数的查询字符串,这样就可以比EXEC更好的重用执行计划,sp_executesql的构成与存储过程非常相似,不同之处在于你是动态构建代码。它的构成包括:代码快,参数声明部分,参数赋值部分。说了这么多,还是看看它的语法:  

@stmt参数是输入的动态批处理,它可以引入输入参数或输出参数,和存储过程的主体语句一样,只不过它是动态的,而存储过程是静态的,不过你也可以在存储过程中使用sp_executesql; @params参数与定义输入/输出参数的存储过程头类似,实际上和存储过程头的语法完全一样; @<params assignment> 与调用存储过程的EXEC部分类似。 其实@stmt,@params可以省略,那么exec sp_executesql的语法就可以简写成如下格式:

  为了说明sp_executesql对执行计划的管理优于EXEC,我将使用前面讨论EXEC时用到的代码。   代码

  下面我们看看exec sp_executesql的执行效率,在调用该代码和检查它生成的执行计划前,先清空缓存中的执行计划; DBCC FREEPROCCACHE 将上面的动态代码执行3次,每次执行都赋予@OrderID 不同的值,然后查询sys.syscacheobjects表,并注意它的输出,优化器只创建了一个备用计划,而且该计划被重用的3次   SELECT cacheobjtype,objtype,usecounts,sql FROM sys.syscacheobjects   WHERE sql NOT LIKE '%cache%' AND sql NOT LIKE '%sys.%' AND sql NOT LIKE '%sp_executesql%' 点击F5运行。 sq_executesql的另一个与其接口有关的强大功能是,你可以使用输出参数为调用批处理中的变量返回值。利用该功能可以避免用临时表返回数据,从而得到更高效的代码和更少的重新编译。定义和使用输出参数的语法与存储过程类似。也就是说,你需要在声明参数时指定OUTPUT子句。例如,下面的静态代码简单的演示了如何从动态批处理中利用输出参数@p把值返回到外部批处理中的变量@i.  

  以字母 N 为前缀标识 Unicode 字符串常量  总结以下几点:   一.使用exce sp_executesql效率比exec要高,同一类型的语句,只需编译一次即可,而exec执行几次就需要编译几次。 二.构造动态sql的where子句,也就是条件子句时,exec无法使用变量来进行站位,需要将变量转换成字符串,然后和动态sql进行拼接,这就可能引起Sql注入问题,如下: SET @sql = 'SELECT * FROM '+QUOTENAME(@TableName) +    ' WHERE OrderID = '+CAST(@OrderID AS VARCHAR(50)) + ' ORDER BY ORDERID DESC'   而若使用exec sp_executesql则可以使用变量来进行站位,以后再给这个参数传值的放式构造动态sql,就避免的Sql注入的问题,如下:

三.无论是Exec还是Exec sp_executesql,如果想要将表名和列名进行动态参数化,不可以使用表名参数和列名参数来进行站位,而且表名参数和列名参数需要使用存储过程的参数.对     于exec sp_executesql来说,不可以将表名参数和列名参数在指定为在exec sp_executesql参数声明部分声明的参数,如: 代码

也就是说exec sp_executesql语句的参数声明部分只能声明动态sql的where子句的参数。   转自:http://www.cnblogs.com/RascallySnake/archive/2010/05/20/1739839.html

SqlServer2005高效分页sql查询语句汇总

sqlserver2005不支持关键字limit ,所以它的分页sql查询语句将不能用mysql的方式进行,幸好sqlserver2005提供了top,rownumber等关键字,这样就能通过这几个关键字实现分页。 下面是本人在网上查阅到的几种查询脚本的写法: 几种sqlserver2005高效分页sql查询语句 top方案:   sql codeselect top 10 * from table1   where id not in(select top 开始的位置 id from table1) max:    sql codeselect top 10 * from table1    where id>(select max(id)    from (select top 开始位置 id from table1order by id)tt) row: sql codeselect * from (    select row_number()over(order by tempcolumn)temprownumber,*    from (select top 开始位置+10 tempcolumn=0,* from table1)t )tt where temprownumber>开始位置 3种分页方式,分别是max方案,top方案,row方案 效率: 第1:row 第2:max 第3:top 缺点: max:必须用户编写复杂sql,不支持非唯一列排序 top:必须用户编写复杂sql,不支持复合主键 row:不支持sqlserver2000 测试数据: 共320万条数据,每页显示10条数据,分别测试了2万页、15万页和32万页。 页码,top方案,max方案,row方案 2万,60ms,46ms,33ms 15万,453ms,343ms,310ms 32万,953ms,720ms,686ms 是一种通过程序拼接sql语句的分页方案, 用户提过的sql语句不需要编写复杂的sql逻辑 诺用户提供sql如下 sql code select * from table1 从第5条开始,查询5条,处理后sql变为 sql code select * from (    select row_number()over(order by tempcolumn)temprownumber,*    from (select top 10 tempcolumn=0,* from table1)t )tt where temprownumber>5 这是什么意思呢?分解一下 首先将用户输入的sql语句转稍稍修改 在select后添加top 开始位置+条数变成 再外加一列tempcolum,变成这样 sql code select top 20 tempcolumn=0,* from clazz 嵌套一层,这样便可查询出行号   刚才那个列就是用来这里order by用的 (也不知道sqlserver的row_number函数为什么必须要order by) sql code select row_number()over(order by tempcolumn)temprownumber,* from (修改过的查询)t 再套一层,过滤掉行号小于开始位置的行 sql code select * from (第二层)tt where temprownumber>10 转自:http://blog.sina.com.cn/s/blog_669129380100lpmp.html