2016-11-10 47 views
1

目前我通过检索IQueryable<T1>的方法从数据库中检索数据,过滤,排序然后将其分页(所有这些都基本在数据库上),之前将结果返回到UI以显示在分页表中。来自多个来源的过滤,合并,排序和页面数据

我需要集成来自另一个数据库的结果,而分页似乎是主要问题。

  • 模型类似但不相同(相同的字段,不同的名称,在返回之前需要映射到通用域模型);
  • 加入数据库级别是不可能的;
  • 目前在两个数据库之间有〜1000条记录(在过去18个月内的 期间添加),并且可能以大致相同(缓慢)的速度增长;
  • 结果总是需要按1-2个字段排序(日期明智)。

我目前正在撕裂这2个解决方案之间:

  1. 检索来自两个来源的所有数据,合并,排序,然后缓存他们。然后在接收请求时简单地筛选和分页缓存 - 但是当收集被修改时(我可以),我需要使缓存无效。
  2. 过滤每个数据源的数据(同样在数据库级别),然后在返回之前检索,合并,排序&页面。

我正在寻找一个体面的算法性能明智。理想的解决方案可能是它们之间的组合(缓存+在数据库级别进行过滤),但目前我还没有围绕过这个方向。

+0

对面的数据库包含重复? – SilentTremor

+0

否定,没有重复 –

+0

我喜欢你的问题;)我做了类似的事情,但没有分页,我会尝试看看是否可以将分页添加到我在那里。 – SilentTremor

回答

0

我认为你可以使用下面的算法。假设你的页面大小是10,那么对于页面0:

  1. 从数据库A获得10个结果,在数据库级别进行过滤和排序。
  2. 从数据库B获得10个结果,在db级别进行过滤和排序(与上面的查询并行)
  3. 将这两个结果组合起来,以正确的排序顺序获得10条记录。所以,你有20个记录排序,但把他们和显示的只有前10的UI

然后第1页:你如何使用用户界面来显示从数据库A和B的许多项目

  1. 公告在上一步。例如,您使用数据库A中的2个项目和数据库B中的8个项目。
  2. 从数据库A获得10个结果,已筛选和排序,但从位置2开始(跳过2),因为已经在UI中显示了这两个结果。
  3. 从数据库B获得10个结果,过滤并排序,但从位置8开始(跳过8)。
  4. 合并与上述相同的方法从20中获得10条记录。现在假设您使用了A中的5个项目和B中的5个项目。现在总共显示了来自A的7个项目和来自B的13个项目。下一步的数字。

这不会允许(很容易)跳过页面,但据我所知,这不是一个要求。

性能应该与查询单个数据库时的效率相同,因为对A和B的查询可以并行完成。

+0

我理解你提出的解决方案,并想到它之前,但我需要以RESTful的方式做到这一点,而不必记住单个项目索引 - 此外,我讨厌不得不扩大up –

+0

但是你需要记住现在你在哪个页面,为什么不记得2个数字?您将所有内容存储在客户端上,而不是服务器上,因此不确定它与RESTful ness的关系如何。 – Evk

+0

您可能意思是您不希望将两个不明确的参数添加到REST API中。那么,这可能是合理的。至于规模 - 将所有数据拉入内存和在那里工作的规模很大。 – Evk

0

我在这里创建了一些东西,如果需要的话,我会回来解释。 我不确定我的算法对所有边缘情况都能正确运行,它涵盖了我所想到的所有情况,但你永远不知道。我将把代码留在这里以供您的乐趣,我会回答并解释如果您需要这些代码,请发表评论。

然后执行多个测试,其中的值之间有很大差距的项目列表。

using System; 
using System.Collections.Generic; 
using System.Linq; 

namespace ConsoleApplication1 
{ 
    class Program 
    { 
     //each time when this objects are accessed, consider as a database call 
     private static IQueryable<model1> dbsetModel_1; 
     private static IQueryable<model2> dbsetModel_2; 

     private static void InitDBSets() 
     { 
      var rnd = new Random(); 
      List<model1> dbsetModel1 = new List<model1>(); 
      List<model2> dbsetModel2 = new List<model2>(); 
      for (int i = 1; i < 300; i++) 
      { 
       if (i % 2 == 0) 
       { 
        dbsetModel1.Add(new model1() { Id = i, OrderNumber = rnd.Next(1, 10), Name = "Test " + i.ToString() }); 
       } 
       else 
       { 
        dbsetModel2.Add(new model2() { Id2 = i, OrderNumber2 = rnd.Next(1, 10), Name2 = "Test " + i.ToString() }); 
       } 
      } 
      dbsetModel_1 = dbsetModel1.AsQueryable(); 
      dbsetModel_2 = dbsetModel2.AsQueryable(); 
     } 

     public static void Main() 
     { 
      //generate sort of db data 
      InitDBSets(); 
      //test 
      var result2 = GetPage(new PagingFilter() { Page = 5, Limit = 10 }); 
      var result3 = GetPage(new PagingFilter() { Page = 6, Limit = 10 }); 
      var result5 = GetPage(new PagingFilter() { Page = 7, Limit = 10 }); 
      var result6 = GetPage(new PagingFilter() { Page = 8, Limit = 10 }); 
      var result7 = GetPage(new PagingFilter() { Page = 4, Limit = 20 }); 
      var result8 = GetPage(new PagingFilter() { Page = 200, Limit = 10 }); 

     } 


     private static PagedList<Item> GetPage(PagingFilter filter) 
     { 
      int pos = 0; 
      //load only start pages intervals margins from both database 
      //this part need to be transformed in a stored procedure on db one, skip, take to return interval start value for each frame 
      var framesBordersModel1 = new List<Item>(); 
      dbsetModel_1.OrderBy(x => x.Id).ThenBy(z => z.OrderNumber).ToList().ForEach(i => { 
       pos++; 
       if (pos - 1 == 0) 
       { 
        framesBordersModel1.Add(new Item() { criteria1 = i.Id, criteria2 = i.OrderNumber, model = i }); 
       } 
       else if ((pos - 1) % filter.Limit == 0) 
       { 
        framesBordersModel1.Add(new Item() { criteria1 = i.Id, criteria2 = i.OrderNumber, model = i }); 
       } 

      }); 
      pos = 0; 
      //this part need to be transformed in a stored procedure on db two, skip, take to return interval start value for each frame 
      var framesBordersModel2 = new List<Item>(); 
      dbsetModel_2.OrderBy(x => x.Id2).ThenBy(z => z.OrderNumber2).ToList().ForEach(i => { 
       pos++; 
       if (pos - 1 == 0) 
       { 
        framesBordersModel2.Add(new Item() { criteria1 = i.Id2, criteria2 = i.OrderNumber2, model = i }); 
       } 
       else if ((pos -1) % filter.Limit == 0) 
       { 
        framesBordersModel2.Add(new Item() { criteria1 = i.Id2, criteria2 = i.OrderNumber2, model = i }); 
       } 

      }); 

      //decide where is the position of your cursor based on start margins 
      //int mainCursor = 0; 
      int cursor1 = 0; 
      int cursor2 = 0; 
      //filter pages start from 1, filter.Page cannot be 0, if indeed you have page 0 change a lil' bit he logic 
      if (framesBordersModel1.Count + framesBordersModel2.Count < filter.Page) throw new Exception("Out of range"); 
      while (cursor1 + cursor2 < filter.Page -1) 
      { 
       if (framesBordersModel1[cursor1].criteria1 < framesBordersModel2[cursor2].criteria1) 
       { 
        cursor1++; 
       } 
       else if (framesBordersModel1[cursor1].criteria1 > framesBordersModel2[cursor2].criteria1) 
       { 
        cursor2++; 
       } 
       //you should't get here case main key sound't be duplicate, annyhow 
       else 
       { 
        if (framesBordersModel1[cursor1].criteria2 < framesBordersModel2[cursor2].criteria2) 
        { 
         cursor1++; 
        } 
        else 
        { 
         cursor2++; 
        } 
       } 
       //mainCursor++; 
      } 
      //magic starts 
      //inpar skipable 
      int skipEndResult = 0; 
      List<Item> dbFramesMerged = new List<Item>(); 
      if ((cursor1 + cursor2) %2 == 0) 
      { 
       dbFramesMerged.AddRange(
        dbsetModel_1.OrderBy(x => x.Id) 
         .ThenBy(z => z.OrderNumber) 
         .Skip(cursor1*filter.Limit) 
         .Take(filter.Limit) 
         .Select(x => new Item() {criteria1 = x.Id, criteria2 = x.OrderNumber, model = x}) 
         .ToList()); //consider as db call EF or Stored Procedure 
       dbFramesMerged.AddRange(
        dbsetModel_2.OrderBy(x => x.Id2) 
         .ThenBy(z => z.OrderNumber2) 
         .Skip(cursor2*filter.Limit) 
         .Take(filter.Limit) 
         .Select(x => new Item() {criteria1 = x.Id2, criteria2 = x.OrderNumber2, model = x}) 
         .ToList()); 
       ; //consider as db call EF or Stored Procedure 
      } 
      else 
      { 
       skipEndResult = filter.Limit; 
       if (cursor1 > cursor2) 
       { 
        cursor1--; 
       } 
       else 
       { 
        cursor2--; 
       } 
       dbFramesMerged.AddRange(
        dbsetModel_1.OrderBy(x => x.Id) 
         .ThenBy(z => z.OrderNumber) 
         .Skip(cursor1 * filter.Limit) 
         .Take(filter.Limit) 
         .Select(x => new Item() { criteria1 = x.Id, criteria2 = x.OrderNumber, model = x }) 
         .ToList()); //consider as db call EF or Stored Procedure 
       dbFramesMerged.AddRange(
        dbsetModel_2.OrderBy(x => x.Id2) 
         .ThenBy(z => z.OrderNumber2) 
         .Skip(cursor2 * filter.Limit) 
         .Take(filter.Limit) 
         .Select(x => new Item() { criteria1 = x.Id2, criteria2 = x.OrderNumber2, model = x }) 
         .ToList()); 
      } 

      IQueryable<Item> qItems = dbFramesMerged.AsQueryable(); 
      PagedList<Item> result = new PagedList<Item>(); 
      result.AddRange(qItems.OrderBy(x => x.criteria1).ThenBy(z => z.criteria2).Skip(skipEndResult).Take(filter.Limit).ToList()); 

      //here again you need db cals to get total count 
      result.Total = dbsetModel_1.Count() + dbsetModel_2.Count(); 
      result.Limit = filter.Limit; 
      result.Page = filter.Page; 
      return result; 
     } 
    } 

    public class PagingFilter 
    { 
     public int Limit { get; set; } 
     public int Page { get; set; } 
    } 



    public class PagedList<T> : List<T> 
    { 

     public int Total { get; set; } 
     public int? Page { get; set; } 
     public int? Limit { get; set; } 
    } 

    public class Item : Criteria 
    { 
     public object model { get; set; } 
    } 

    public class Criteria 
    { 
     public int criteria1 { get; set; } 
     public int criteria2 { get; set; } 
     //more criterias if you need to order 
    } 

    public class model1 
    { 
     public int Id { get; set; } 
     public int OrderNumber { get; set; } 
     public string Name { get; set; } 
    } 

    public class model2 
    { 
     public int Id2 { get; set; } 
     public int OrderNumber2 { get; set; } 
     public string Name2 { get; set; } 
    } 
} 
相关问题