LinQ to SQL 使用 Any() 时抛出 Stackoverflow 异常
问题:LinQ to SQL 使用 Any() 时抛出 Stackoverflow 异常
我正在使用看起来像这样的 LinQ 查询
public List<TEntity> GetEntities<TEntity>(int[] ids)
{
var someDbSet = new DbSet<TEntity>();
var resultQ = someDbSet.Where(t => !ids.Any() || ids.Contains(t.ID)); //<= crashing line
return resultQ.toList();
}
它通常可以工作,但在某些情况下,当 ids 大小约为 7000 个项目时,它会崩溃。抛出的异常消息是“抛出了 'System.StackOverflowException' 类型的异常。”。它没有堆栈跟踪或 InnerException。
我也得到这个信息:“EntityFramework.pdb not loaded...包含查找模块EntityFramework.dll的源所需的调试信息”
这是一个已知的错误还是有人可以解释为什么当数组更大时它不起作用?
我正在使用 .NET Framework 4.5、EntityFramework 6.1.3、EntityFramework6.Npgsql 3.0.3
解答
如果我们将一个只有两个值int[] ids = {1, 2}的数组传递给您的方法GetEntitiesEntityFramework 将生成下一个查询:
SELECT
[Extent1].[Id] AS [Id],
...
FROM [dbo].[Entity] AS [Extent1]
WHERE ( NOT EXISTS (SELECT
1 AS [C1]
FROM (SELECT
1 AS [C0]
FROM ( SELECT 1 AS X ) AS [SingleRowTable1]
UNION ALL
SELECT
1 AS [C0]
FROM ( SELECT 1 AS X ) AS [SingleRowTable2]) AS [UnionAll1]
)) OR (1 = [Extent1].[Id]) OR (2 = [Extent1].[Id])
如果我们增加ids数组中的元素数量,这个查询会变得更复杂,嵌套层次更多。我认为 EntityFramework 使用一些递归算法为!ids.Any()表达式生成 SQL 代码。当ids数组中的元素数量增加时,递归的深度也会增加。因此,当ids数组中的元素数量(以及递归深度)很大时,它会生成StackOverflowException。
如果我们删除!ids.Any()表达式,将生成下一个查询:
SELECT
[Extent1].[Id] AS [Id],
...
FROM [dbo].[Entity] AS [Extent1]
WHERE [Extent1].[Id] IN (1,2)
当ids数组中的元素数量很大时,这样的查询不会生成StackOverflowException。因此最好从 LINQ 查询中提取!ids.Any()表达式:
public List<TEntity> GetEntities<TEntity>(int[] ids)
{
var someDbSet = new DbSet<TEntity>();
if (!ids.Any())
return someDbSet.ToList();
var resultQ = someDbSet.Where(t => ids.Contains(t.ID));
return resultQ.toList();
}
您还应该考虑到WHERE IN条件的项目数量有限制:Limit on the WHERE col IN (...) 条件。
ionutnespus 写道:
是的,提取 Where() 之外的条件是有效的。尽管如此,我还是找不到任何解释为什么 EF 会为如此简单的条件使用如此复杂的算法。对此有什么想法吗?
我决定通过扩展这篇文章来回答这个问题,因为答案很大并且包含代码。
我不确定为什么 EF 会生成如此复杂的查询,但我已经进行了一些研究,这是我的想法。如果我们修改您的GetEntites方法并在 LINQ 查询中使用下一个条件:
someDbSet.Where(t => !ids.Any(i => i == 3) || ids.Contains(t.ID));
如果ids = {1, 2}将生成下一个 SQL 查询:
SELECT
[Extent1].[Id] AS [Id],
...
FROM [dbo].[Entity] AS [Extent1]
WHERE ( NOT EXISTS (
SELECT 1 AS [C1]
FROM (
SELECT 1 AS [C0] FROM ( SELECT 1 AS X ) AS [SingleRowTable1] WHERE 3 = 1
UNION ALL
SELECT 1 AS [C0] FROM ( SELECT 1 AS X ) AS [SingleRowTable2] WHERE 3 = 2
) AS [UnionAll1]
)) OR (1 = [Extent1].[Id]) OR (2 = [Extent1].[Id])
在这里您可以看到NOT EXISTS条件包含两个子查询,每个子查询检查ids数组的下一个元素是否等于所需值。我认为使用NOT EXISTSSQL-condition 来表示Any()方法是合乎逻辑的。但是为什么 EF 会为每个数组元素生成一个子查询呢?在我看来,EF 这样做是因为 EF 团队试图编写生成不依赖于数据库类型的查询的算法。但这只是我的意见。可能最好在github上问这个问题 EF Team。
更多推荐
所有评论(0)