2017-09-06 34 views
10

大多数std::string实现(包括GCC)使用小字符串优化。例如。有一个answer讨论这一点。gcc没有小字符串优化?

今天,我决定检查我编译的代码中的一个字符串被移到堆中的哪一点。令我惊讶的是,我的测试代码似乎显示根本没有发生小字符串优化!

代码:

#include <iostream> 
#include <string> 

using std::cout; 
using std::endl; 

int main(int argc, char* argv[]) { 
    std::string s; 

    cout << "capacity: " << s.capacity() << endl; 

    cout << (void*)s.c_str() << " | " << s << endl; 
    for (int i=0; i<33; ++i) { 
    s += 'a'; 
    cout << (void*)s.c_str() << " | " << s << endl; 
    } 

} 

g++ test.cc && ./a.out输出是

capacity: 0 
0x7fe405f6afb8 | 
0x7b0c38 | a 
0x7b0c68 | aa 
0x7b0c38 | aaa 
0x7b0c38 | aaaa 
0x7b0c68 | aaaaa 
0x7b0c68 | aaaaaa 
0x7b0c68 | aaaaaaa 
0x7b0c68 | aaaaaaaa 
0x7b0c98 | aaaaaaaaa 
0x7b0c98 | aaaaaaaaaa 
0x7b0c98 | aaaaaaaaaaa 
0x7b0c98 | aaaaaaaaaaaa 
0x7b0c98 | aaaaaaaaaaaaa 
0x7b0c98 | aaaaaaaaaaaaaa 
0x7b0c98 | aaaaaaaaaaaaaaa 
0x7b0c98 | aaaaaaaaaaaaaaaa 
0x7b0cd8 | aaaaaaaaaaaaaaaaa 
0x7b0cd8 | aaaaaaaaaaaaaaaaaa 
0x7b0cd8 | aaaaaaaaaaaaaaaaaaa 
0x7b0cd8 | aaaaaaaaaaaaaaaaaaaa 
0x7b0cd8 | aaaaaaaaaaaaaaaaaaaaa 
0x7b0cd8 | aaaaaaaaaaaaaaaaaaaaaa 
0x7b0cd8 | aaaaaaaaaaaaaaaaaaaaaaa 
0x7b0cd8 | aaaaaaaaaaaaaaaaaaaaaaaa 
0x7b0cd8 | aaaaaaaaaaaaaaaaaaaaaaaaa 
0x7b0cd8 | aaaaaaaaaaaaaaaaaaaaaaaaaa 
0x7b0cd8 | aaaaaaaaaaaaaaaaaaaaaaaaaaa 
0x7b0cd8 | aaaaaaaaaaaaaaaaaaaaaaaaaaaa 
0x7b0cd8 | aaaaaaaaaaaaaaaaaaaaaaaaaaaaa 
0x7b0cd8 | aaaaaaaaaaaaaaaaaaaaaaaaaaaaaa 
0x7b0cd8 | aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa 
0x7b0cd8 | aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa 
0x7b0d28 | aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa 

我猜测,较大的第一指针,即0x7fe405f6afb8是一个堆栈指针,和其他的指向堆。多次运行会产生相同的结果,因为第一个地址总是很大,而其他地址较小;确切的值通常是不同的。较小的地址总是遵循2分配方案的标准功率,例如, 0x7b0c38列出一次,然后0x7b0c68列出一次,然后0x7b0c38两次,然后0x7b0c68 4次,然后0x7b0c98 8倍等

阅读霍华德的答案,使用64位的机器后,我原以为会看到相同的地址打印为前22个字符,然后才能看到它的变化。

我错过了什么吗?

另外,有趣的是,如果我-O编译(任何级别),我在第一种情况下获得恒定的小指针值0x6021f8,而不是大的价值,这0x6021f8不会改变,无论多少次我运行该程序。

g++ -v输出:

Using built-in specs. 
COLLECT_GCC=g++ 
COLLECT_LTO_WRAPPER=/foo/bar/gcc-6.2.0/gcc/libexec/gcc/x86_64-redhat-linux/6.2.0/lto-wrapper 
Target: x86_64-redhat-linux 
Configured with: ../gcc-6.2.0/configure --prefix=/foo/bar/gcc-6.2.0/gcc --build=x86_64-redhat-linux --disable-multilib --enable-languages=c,c++,fortran --with-default-libstdcxx-abi=gcc4-compatible --enable-bootstrap --enable-threads=posix --with-long-double-128 --enable-long-long --enable-lto --enable-__cxa_atexit --enable-gnu-unique-object --with-system-zlib --enable-gold 
Thread model: posix 
gcc version 6.2.0 (GCC) 
+1

'--with-default-libstdcxx-abi = gcc4-compatible' –

+0

@ T.C。真? 'gcc4'没有小字符串优化? – SU3

+0

我以为我记得小字符串优化必须放回(回)到语言 – xaxxon

回答

13

你的一个标志是:

--with-default-libstdcxx-abi=gcc4-compatible 

和GCC4不支持小串optimzation。


GCC5开始支持它。 isocpp states:

默认情况下启用std :: string的新实现,使用小字符串优化而不是写入时复制引用计数。

它支持我的说法。

此外,Exploring std::string提到:

正如我们看到的,年纪大的libstdC++工具写入时复制,所以它使 感为他们不使用的小物件优化。

然后当GCC5进场时他改变了上下文。