关联矩阵C++太大

哪里可以减小矩阵的大小？（x2数组）例如，我只需要将数据（0,1,2）存储到数组中，但元素可以高达250 000。有没有一种方法来存储值，如在字典..？关联矩阵C++太大

const int MAX = 250000; 
short data[MAX][MAX] = {};//wont compile..

来源

2014-04-10 Daniel

'的std :: unordered_map >'将是我最初的想法。 – WhozCraig

*我只需将数据（0,1,2）存储到数组中，但元素可以高达250 000 *这是非常不清楚的。矩阵的维度是什么？什么是值的{最小值，最大值}范围？每行/列有多少个非零元素？ – japreiss

值可以是只有0，1，2 但键可以高达250 000，例如数据[249043] [245235] = 0 – Daniel

我记得静态变量的sizeof有一些限制。使用动态内存。根据元素数量和内存限制，您可以使用不同类型的存储。

当元素数量少于某个预定义值时，换句话说数据密度低，可以使用稀疏矩阵。稀疏矩阵的想法很简单：你不保留所有可能的元素;相反，你保持一些大数目的元素的简单数组，比如1000，类型为struct {int line，row;无符号字符值;}。达到某个值时，这种数组的内存消耗小于矩阵。但随机访问可能会造成很大的开销。可以应用一些优化来减少它。
如果数据密度很高，“活动”元素的数量很大，使用压缩矩阵和位填充可以实现一些效果。这可以通过记忆非常有效。在你的例子中，每个值只需要2位，所以int64会将32个值保留在“行”中。这里需要精细优化的访问方法来减少时间消耗。
您可以在上述解决方案之间切换，从稀疏矩阵迁移到压缩矩阵。

来源

2014-04-10 18:23:54

这完美的工作对我来说，因为我上面的评论（live here）：

#include <iostream> 
#include <unordered_map> 

std::unordered_map<unsigned int, std::unordered_map<unsigned int, unsigned char>> data; 

int main() { 
    std::cout << "oi" << std::endl; 

    data[232432][234234] = 2; 
    data[2][2] = 1; 
    std::cout << int(data[232432][234234]) << std::endl; 
    std::cout << int(data[3][3]) << std::endl; 
    std::cout << int(data[232432][1]) << std::endl; 
    std::cout << int(data[2][2]) << std::endl; 
}

来源

2014-04-10 19:04:55 Massa

完美！但为了保持兼容性不仅仅适用于C++ 11？：） – Daniel

如果数据非常稀疏，然后Massa's approach具有每每个项目的额外unordered_map的开销。较低的开销的解决办法是指数无序地图对：

#include <iostream> 
#include <unordered_map> 

/// Hash specialization for a pair of unsigned ints 
template<> struct std::hash<std::pair<unsigned int, unsigned int>> 
{ 
    typedef std::pair<unsigned int, unsigned int> argument_type; 
    typedef std::size_t value_type; 
    value_type operator()(argument_type const& s) const 
    { 
    value_type const h1 (std::hash<unsigned int>()(s.first)); 
    value_type const h2 (std::hash<unsigned int>()(s.second)); 
    return h1^(h2 << 1); 
    } 
}; 

std::unordered_map<std::pair<unsigned int, unsigned int>, unsigned char> data; 

int main() { 
    using std::make_pair; 
    data[make_pair(232432u, 234234u)] = 2; 
    data[make_pair(2u, 3u)] = 1; 
    std::cout << int(data[make_pair(232432u, 234234u)]) << std::endl; 
    std::cout << int(data[make_pair(3u, 3u)]) << std::endl; 
    std::cout << int(data[make_pair(232432u, 1u)]) << std::endl; 
    std::cout << int(data[make_pair(2u, 3u)]) << std::endl; 
}

来源

2014-04-10 19:19:34

这很好，但不仅对C++ 11兼容？那么搜索价值呢？ – Daniel

压缩
您可以压缩的数据值，这将节省你的内存，但增加的访问时间。

您的取值范围：0,1,2，占用2位来表示。因此，一个8位，uint8_t，变量可以容纳4列值：

3 2 1 0 
+--+--+--+--+ 
|xx|xx|xx|xx| 
+--+--+--+--+

要访问该值，则需要执行一些二进制算术：

value of column 0 == (byte & 0x03); /* >> 0 */ 
value of column 1 == (byte & 0x0c) >> 2; 
value of column 2 == (byte & 0x30) >> 4; 
value of column 3 == (byte & 0xC0) >> 6;

字节将被访问：(index/4)

变化的角度
因为你只有3个值，你可以在坐标存储在一个数组列表。你会搜索数组的坐标。

Data  row col  row col 
+---+  +-----+----+  +-----+---+ 
| 0 | --> | 115 | 25 | --> |20961| 4 | 
+---+  +-----+----+  +-----+---+ 
| 1 | 
+---+ 
| 2 | 
+---+

在上面的例子中，矩阵位置[115] [25]包含零以及[4]。

在上述技术中，您可以使用范围压缩矩阵位置。

来源

2014-04-10 20:00:39

这是个好主意，但是搜索呢？获取键键索引的价值需要更长的时间吗？ – Daniel

你将不得不分析它。大多数搜索和排序算法的效率在一定程度上取决于数据。 –

关联矩阵C++太大

回答

相关问题