2013-08-28 104 views
0

我有一个包含文件列表(大约6000个文件)的数据库。所有这些文件都有一些额外的详细信息(如项目编号,部门,客户,评论,学科)。搜索代码优化 - CakePHP

虽然代码和搜索起作用,但速度很慢。有两个条件的简单搜索大约需要一分钟才能完成。

我的代码如下。我想知道的是,我可以做些什么来简化和优化我的搜索功能?

public function search() { 
    $Terms = explode(' ',$this->request->data['KmFiles']['search']); 
    $possible = 0; 
    $Matches = array(); 
    foreach($Terms as $Term) { 
     $Files = $this->KmFile->find('list', 
      array(
       'conditions' => array(
        'file_name LIKE' => '%' . $Term . '%' 
       ), 
       'fields' => array('id') 
      ) 
     ); 
     $possible++; 
     $Clients = $this->KmClient->find('list', 
      array(
       'conditions' => array(
        'clients LIKE' => '%' . $Term . '%' 
       ), 
       'fields' => array('km_file_id') 
      ) 
     ); 
     $possible++; 
     $Disciplines = $this->KmDiscipline->find('list', 
      array(
       'conditions' => array(
        'disciplines LIKE' => '%' . $Term . '%' 
       ), 
       'fields' => array('km_file_id') 
      ) 
     ); 
     $possible++; 
     $Projects = $this->KmProject->find('list', 
      array(
       'conditions' => array(
        'projects LIKE' => '%' . $Term . '%' 
       ), 
       'fields' => array('km_file_id') 
      ) 
     ); 
     $possible++; 
     $Sectors = $this->KmSector->find('list', 
      array(
       'conditions' => array(
        'sectors LIKE' => '%' . $Term . '%' 
       ), 
       'fields' => array('km_file_id') 
      ) 
     ); 
     $possible++; 
     $Comments = $this->KmComment->find('list', 
      array(
       'conditions' => array(
        'comments LIKE' => '%' . $Term . '%' 
       ), 
       'fields' => array('km_file_id') 
      ) 
     ); 
     $possible++; 
     $Matches = array_merge($Matches,$Files,$Clients,$Disciplines,$Projects,$Sectors,$Comments); 
    } 
    if(count($Matches) > 0) { 
     $NumberOfMatches = array_count_values($Matches); 
     $Matches = array_unique($Matches); 
     $k=0; 
     foreach($Matches as $Match) { 
      $Result = $this->KmFile->find('all', 
       array(
        'conditions' => array(
         'id' => $Match 
        ) 
       ) 
      ); 
     $Results[$k] = $Result[0]; 
     $Results[$k]['Relevance'] = round(($NumberOfMatches[$Match]/$possible) * 100,2); 
     $relevance[] = $Results[$k]['Relevance']; 
     $k++; 
    } 
     array_multisort($relevance,SORT_DESC,$Results); 
     $Stats['Count'] = count($Results); 
     $Stats['Terms'] = $this->request->data['KmFiles']['search']; 
     $this->set(compact('Results','Stats')); 
    } else { 
     $Stats['Count'] = 0; 
     $Stats['Terms'] = $this->request->data['KmFiles']['search']; 
     $this->set(compact('Stats')); 
    } 
} 

我知道这是一段很长的代码,但是我对CakePHP相当陌生,所以不知道该怎么做来改进它。

任何援助将不胜感激。

回答

0

为了让速度更快,您必须尽可能多地推迟数据库的责任(数据库现在真的很快!),并尽量减少PHP和数据库之间的来回。理想情况下,您可以通过单个查询获取所有搜索结果(例如,单个呼叫find)。

您会指定joins,这样您的KmFile模型就会与您的KmClient,KmProject等表格加在一起。

然后,这只是建立一个长条件数组的问题。在complex find conditions

array('OR' => array(
    array('Post.title LIKE' => '%one%'), 
    array('Post.title LIKE' => '%two%') 
)) 

退房的DOCO:蛋糕,你可以指定 'OR' 条件是这样的。你的条件阵列看起来像这样:

array('OR' => array(
    array('KmFile.file_name LIKE' => '%term1%'), 
    array('KmFile.file_name LIKE' => '%term2%'), 
    array('KmDiscipline.disciplines LIKE' => '%term1%'), 
    array('KmDiscipline.disciplines LIKE' => '%term2%'), 
    array('KmProject.projects LIKE' => '%term1%'), 
    array('KmProject.projects LIKE' => '%term2%'), 
    // and so on... 
)) 

显然你想要使用循环来建立你的条件数组。

然后,在你的KmFile模型上,加入所有相关模型,并附上大量条件列表。这将返回一个匹配列表,并且不应该花太长时间。

虽然我不知道该怎么做,但在同一个查询中计算某种相关性分数可能是可能的。无论如何,一旦您将查找结果恢复为单个查询,在PHP代码中循环查找结果并计算每个查询的相关性应该不会太长。