2013-03-06 31 views
1

我有以下Perl脚本,旨在以丹麦语显示整理。AA和丹麦语整理是什么?

#!/usr/local/ActivePerl-5.16/bin/perl 

use 5.014_001; 
use utf8; 
use Unicode::Collate; 
use strict; 
use warnings; 
use Carp; 
use Data::Dump; 
use Encode qw(encode_utf8); 
use Unicode::Collate::Locale; 


binmode STDOUT, ':encoding(UTF-8)'; 

my @words =("AAI Document Type", "Apple", "Zebra"); 

my $coll = Unicode::Collate::Locale->new(locale => "da"); 

my @result = $coll->sort(@words); 


foreach my $item (@result){ 
print $item, "\n"; 
} 

它输出

Apple 
Zebra 
AAI Document Type 

为什么 “AAI文件类型” 走到尽头?似乎有一些关于触发这种行为的“AA”。

回答

3

AA被视为丹麦语的单个字母,也写为Å

详情here

AAI的缩写

显然,治疗AAÅ是不恰当的(它确实是二A字符)。我想,避免这种情况的方法是使用不同的排序规则。

+0

谢谢!我想这是在技术文档中混合语言的一个陷阱。 – egilchri 2013-03-07 03:26:45