2013-03-02 33 views
-4

我的PHP代码包含许多foreach循环,并且结果绝对是灾难性的。运行时间太长。优化使用大量for循环的PHP代码

是否有替代方案。我接受所有建议。

我在想,可能会实现基于Flash的客户端,并使用actionscript来利用客户端的CPU来运行逻辑。

或者有没有办法使用C/C++来处理服务器本身对计算要求较高的部分,并返回PHP的结果。

以下函数被调用1,000,000次。

public function performEnrichmentAnalysis($geneSet) { 
    /** 
    * $mainArray is a multi dimentional array. 
    * EntrezID | Set (0/1) | pValue | rank 
    */ 
    $mainArray = array(); 
    $finalArray = array(); 
    $originalGenesScore = 0; 
    $randomGenesScore = 0; 
    $u = 0; 
    $EntrezID = array(); 
    $Set = array(); 
    $pValue = array(); 
    $Rank = array(); 
    $originalGenes = $geneSet->getGenes(); 
    $memeberCount = $geneSet->getGeneCount(); 
    $randomGenes = $this->geneExpressionData->getRandomGenes($memeberCount); 
    /** 
    * Copy the elements of original and random gene sets to main array. 
    */ 
    foreach ($originalGenes as $key => $value) { 
     $pVal = $this->geneExpressionData->getExpressionValue($value); 
     $array = array('EntrezID' => $value, 'Set' => 0, 'pValue' => $pVal, 'Rank' => 999); 
     array_push($mainArray, $array); 
     unset($array); 
    } 
    foreach ($randomGenes as $key => $value) { 
     $pVal = $this->geneExpressionData->getExpressionValue($value); 
     $array = array('EntrezID' => $value, 'Set' => 1, 'pValue' => $pVal, 'Rank' => 999); 
     array_push($mainArray, $array); 
     unset($array); 
    } 
    /** 
    * sort the multi dimentaional array based on p-values 
    */ 
    foreach ($mainArray as $key => $row) { 
     $EntrezID[$key] = $row['EntrezID']; 
     $Set[$key] = $row['Set']; 
     $pValue[$key] = $row['pValue']; 
     $Rank[$key] = $row['Rank']; 
    } 
    array_multisort($pValue, SORT_ASC, $mainArray); 

    /** 
    * Assign ranks to the genes 
    */ 
    for ($index = 0; $index < count($mainArray); $index++) { 
     $row = $mainArray[$index]; 
     $row['Rank'] = $index + 1; 
     $row['Score'] = 0; 
     //print_r($row['Rank']); 
     array_push($finalArray, $row); 
    } 

    /** 
    * Calculate scores for each gene 
    */ 
    for ($i = 0; $i < count($finalArray); $i++) { 
     for ($j = $i + 1; $j < count($finalArray); $j++) { 
      if ($finalArray[$j]['Set'] != $finalArray[$i]['Set']) { 
       $finalArray[$i]['Score']++; 
      } 
     } 
    } 

    /** 
    * Calculate score for the entire set and get universal U and z score. 
    */ 
    for ($counter = 0; $counter < count($finalArray); $counter++) { 
     if ($finalArray[$counter]['Set'] == 0) { 
      $originalGenesScore += $finalArray[$counter]['Score']; 
     } 
     if ($finalArray[$counter]['Set'] == 1) { 
      $randomGenesScore += $finalArray[$counter]['Score']; 
     } 
    } 

    if ($originalGenesScore > $randomGenesScore) { 
     $u = $randomGenesScore; 
    } else { 
     $u = $originalGenesScore; 
    } 

    $zNumerator = $u - (($memeberCount * $memeberCount)/(2)); 
    $zDenominatorSquared = ($memeberCount * $memeberCount * ($memeberCount + $memeberCount + 1))/12; 

    $z = $zNumerator/sqrt($zDenominatorSquared); 

    if (abs($z) > 2.303) { 
     $this->temp001++; 
    } elseif (abs($z) > 1.605) { 
     $this->temp005++; 
    } else { 
     $this->tempRemaining++; 
    } 
} 
+1

我们需要看到代码,如果你想我们tobhelp你优化。 Alo代码优化可能更多关于[代码评论](http://codereview.stackexchange.com)主题 – 2013-03-02 21:18:26

+1

我觉得你的问题有点太模糊。你没有告诉我们关于你在这些循环中遍历的数据以及你正在运行的计算的任何信息。 – 2013-03-02 21:19:27

+0

对,谢谢。我现在发布了代码。 – Pranjal 2013-03-02 21:24:01

回答

2

那么,这不是真的可以轻松回答的问题。是的,假设你知道C++,代码可以用C++重写。我没有看到任何重大障碍。

您将不得不想出一种方法将原始geneSet转换为C++代码,然后构造一个表示您的$mainArray等的结构。使用std::vector为您的阵列。

由于这段代码本身并不实际生成任何webcontent,因此可以很容易地将该函数替换为对服务器上安装的C++程序的调用。我建议你实际上实现了在C++中调用这个函数的功能,因为如果这被称为1M次,那么你最好在C++中进行1M次调用,而不是在1M次调用一段C++代码。

+0

谢谢Mats Peterson 我是PHP和客户端 - 服务器开发新手。我将用C++重写这个,并从C++程序中调用,但我不清楚如何从PHP调用C++代码。我想从PHP代码发送一个链表和一个数组到C++类,它将工作,然后返回一个数组。 我应该遵循什么步骤? – Pranjal 2013-03-03 04:05:02

+0

我假设调用这个函数1M次需要几秒钟,对吧?因此,将输入数据写入文件是非常合理的,使用'exec()'[或某些类似的PHP函数]来执行C++程序,并将输出结果提供给文件(或“stdout”)可以被捕获)。 – 2013-03-03 12:44:20

+0

谢谢你的帮助。我会试试这个。 – Pranjal 2013-03-03 16:50:22