2014-04-21 123 views
5

我正在尝试使用Cython来包装LAPACK函数dgtsv(三方对称方程组的求解器)。使用Cython包装LAPACKE函数

我碰到了this previous answer,但由于dgtsv不是包装在scipy.linalg中的LAPACK函数,我不认为我可以使用这种特殊方法。相反,我一直在努力遵循this example

这是我的lapacke.pxd文件的内容:

ctypedef int lapack_int 

cdef extern from "lapacke.h" nogil: 

    int LAPACK_ROW_MAJOR 
    int LAPACK_COL_MAJOR 

    lapack_int LAPACKE_dgtsv(int matrix_order, 
          lapack_int n, 
          lapack_int nrhs, 
          double * dl, 
          double * d, 
          double * du, 
          double * b, 
          lapack_int ldb) 

...这里是我的薄用Cython包装在_solvers.pyx

#!python 

cimport cython 
from lapacke cimport * 

cpdef TDMA_lapacke(double[::1] DL, double[::1] D, double[::1] DU, 
        double[:, ::1] B): 

    cdef: 
     lapack_int n = D.shape[0] 
     lapack_int nrhs = B.shape[1] 
     lapack_int ldb = B.shape[0] 
     double * dl = &DL[0] 
     double * d = &D[0] 
     double * du = &DU[0] 
     double * b = &B[0, 0] 
     lapack_int info 

    info = LAPACKE_dgtsv(LAPACK_ROW_MAJOR, n, nrhs, dl, d, du, b, ldb) 

    return info 

...这是一个Python封装和测试脚本:

import numpy as np 
from scipy import sparse 
from cymodules import _solvers 


def trisolve_lapacke(dl, d, du, b, inplace=False): 

    if (dl.shape[0] != du.shape[0] or dl.shape[0] != d.shape[0] - 1 
      or b.shape != d.shape): 
     raise ValueError('Invalid diagonal shapes') 

    if b.ndim == 1: 
     # b is (LDB, NRHS) 
     b = b[:, None] 

    # be sure to force a copy of d and b if we're not solving in place 
    if not inplace: 
     d = d.copy() 
     b = b.copy() 

    # this may also force copies if arrays are improperly typed/noncontiguous 
    dl, d, du, b = (np.ascontiguousarray(v, dtype=np.float64) 
        for v in (dl, d, du, b)) 

    # b will now be modified in place to contain the solution 
    info = _solvers.TDMA_lapacke(dl, d, du, b) 
    print info 

    return b.ravel() 


def test_trisolve(n=20000): 

    dl = np.random.randn(n - 1) 
    d = np.random.randn(n) 
    du = np.random.randn(n - 1) 

    M = sparse.diags((dl, d, du), (-1, 0, 1), format='csc') 
    x = np.random.randn(n) 
    b = M.dot(x) 

    x_hat = trisolve_lapacke(dl, d, du, b) 

    print "||x - x_hat|| = ", np.linalg.norm(x - x_hat) 

不幸的是,test_trisolve只是se grup打电话给_solvers.TDMA_lapacke。 我很确定我的setup.py是正确的 - ldd _solvers.so显示_solvers.so正在运行时链接到正确的共享库。

我不太确定如何从这里开始 - 任何想法?


的简要更新

因为我往往不会立即得到段错误的n较小的值,但我得到的废话结果(|| X - x_hat ||应该是非常接近0):

In [28]: test_trisolve2.test_trisolve(10) 
0 
||x - x_hat|| = 6.23202576396 

In [29]: test_trisolve2.test_trisolve(10) 
-7 
||x - x_hat|| = 3.88623414288 

In [30]: test_trisolve2.test_trisolve(10) 
0 
||x - x_hat|| = 2.60190676562 

In [31]: test_trisolve2.test_trisolve(10) 
0 
||x - x_hat|| = 3.86631743386 

In [32]: test_trisolve2.test_trisolve(10) 
Segmentation fault 

通常LAPACKE_dgtsv返回代码为0(应该指示成功),但偶尔我得到-7,这意味着参数7(b)具有非法值。发生的是只有b的第一个值实际上正在修改。如果我继续拨打test_trisolve,即使n很小,我也会最终遇到段错误。

回答

3

好的,我终于明白了 - 似乎我误解了在这种情况下行列专业所指的。

由于C连续数组遵循行主次序,我假定我应该指定LAPACK_ROW_MAJOR作为LAPACKE_dgtsv的第一个参数。

事实上,如果我改变

info = LAPACKE_dgtsv(LAPACK_ROW_MAJOR, ...) 

info = LAPACKE_dgtsv(LAPACK_COL_MAJOR, ...) 

然后我的函数的工作原理:

test_trisolve2.test_trisolve() 
0 
||x - x_hat|| = 6.67064747632e-12 

这似乎非常反直觉我 - 任何人都可以解释为什么是这样吗?

1

虽然相当古老,但问题似乎仍然相关。 所观察到的行为是参数LDB的曲解的结果:

  • Fortran数组是COL主要和阵列B的主导尺寸对应于N.因此LDB> = MAX(1,N)。
  • 行重大LDB对应于NRHS,因此必须满足条件LDB> = max(1,NRHS)。

评论#b为(LDB,NRHS)是不正确的,因为B具有尺寸(LDB,N)和LDB应在这种情况下是1。

只要NRHS等于1,从LAPACK_ROW_MAJOR切换到LAPACK_COL_MAJOR就可以解决问题。col col(N,1)的内存布局与row major(1,N)相同。然而,如果NRHS大于1,它将会失败。