2014-02-21 40 views
2

我似乎无法找出此正则表达式在PL/SQL中不起作用的原因。IPv6正则表达式(RegEx)不能在PL/SQL中工作

if (REGEXP_LIKE(v,'/^(?>(?>([a-f0-9]{1,4})(?>:(?1)){7}|(?!(?:.*[a-f0-9](?>:|$)){8,})((?1)(?>:(?1)){0,6})?::(?2)?)|(?>(?>(?1)(?>:(?1)){5}:|(?!(?:.*[a-f0-9]:){6,})(?3)?::(?>((?1)(?>:(?1)){0,4}):)?)?(25[0-5]|2[0-4][0-9]|1[0-9]{2}|[1-9]?[0-9])(?>\.(?4)){3}))$/iD')) then 

这是用于验证IPv4和IPv6,它来自这里:https://stackoverflow.com/a/1934546/3112803

不知道这有什么关系,但我也问了一下就完了D标志这个问题:What Does This Regular Expression (RegEx) Flag Mean /iD

出于某种原因,这个正则表达式适用于我的测试在这个网站:http://regex101.com/PL/SQL一切都是无效的。

我的意思是由的是,有一些情况下,我觉得很失败,但我一直在寻找了几天,这是最好的一个我能找到的是在512个字符(512使用REGEXP_LIKE时的限制PL/SQL

我很感激任何帮助。谢谢!

这些是我使用的测试案例...

{1: Initial address, regex should say valid/match} 
select isValid('2001:0db8:0000:0000:0000:ff00:0042:8329','ipv6') from dual; 

{2: After removing all leading zeroes, regex should say valid/match} 
select isValid('2001:db8:0:0:0:ff00:42:8329','ipv6') from dual; 

{3: After omitting consecutive sections of zeroes, regex should say valid/match} 
select isValid('2001:db8::ff00:42:8329','ipv6') from dual; 

{4: The loopback address, regex should say valid/match} 
select isValid('0000:0000:0000:0000:0000:0000:0000:0001','ipv6') from dual; 

{5: The loopback address be abbreviated to ::1 by using both rules, regex should say valid/match} 
select isValid('::1','ipv6') from dual; 

{6: This should be valid/match} 
select isValid('ABCD:ABCD:ABCD:ABCD:ABCD:ABCD:192.168.158.190','ipv6') from dual; 

{7: This should be valid/match} 
select isValid('::','ipv6') from dual; 

{8: IPv6 applications to communicate directly with IPv4 applications, regex should say valid/match} 
select isValid('0:0:0:0:0:ffff:192.1.56.10','ipv6') from dual; 

{9: should NOT be valid/match} 
select isValid('::ffff:192.1.56.10/96','ipv6') from dual; 

{old formats used for tunneling, these should NOT be valid/matches} 
{10} 
select isValid('0:0:0:0:0:0:192.1.56.10','ipv6') from dual; 
{11} 
select isValid('::192.1.56.10/96','ipv6') from dual; 

{These 4 should be valid/match} 
{12} 
select isValid('::FFFF:129.144.52.38','ipv6') from dual; 
{13} 
select isValid('::129.144.52.38','ipv6') from dual; 
{14} 
select isValid('::FFFF:d','ipv6') from dual; 
{15} 
select isValid('1080:0:0:0:8:800:200C:417A','ipv6') from dual; 

{These 4 should NOT be valid/match} 
{16} 
select isValid('::FFFF:d.d.d','ipv6') from dual; 
{17} 
select isValid('::FFFF:d.d','ipv6') from dual; 
{18} 
select isValid('::d.d.d','ipv6') from dual; 
{19} 
select isValid('::d.d','ipv6') from dual; 

有人告诉我,试验#6错了,ABCD:ABCD:ABCD:ABCD:ABCD:ABCD:192.168.158.190是不是一个有效的IPv6地址,是正确的?

测试用例8-11来自这里:http://publib.boulder.ibm.com/infocenter/iseries/v5r3/index.jsp?topic=%2Frzai2%2Frzai2ipv6addrformat.htm但我被告知10 & 11已不再使用。

+1

从XML正则表达式改性不幸的是,Oracle支持仅正则表达式语言的狭窄部分。您的正则表达式在Oracle中不起作用。 –

+0

第二次,测试用例6无效。 10和11也不是。 –

+0

是的,我知道。它也在下面提到。我会更新这个问题,以免混淆。这个被接受的答案是迄今为止我发现的最好答案。然而@nhahtdh不同意你关于项目#6的格式。 – gfrobenius

回答

5

代替在一个单一的正则表达式做的一切,这是更好地打破正则表达式分成较小的并对其进行测试:

if (
    /* IPv6 expanded */ 
    REGEX_LIKE(v, '\A[a-f0-9]{1,4}(:[a-f0-9]{1,4}){7}\z', 'i') 
    /* IPv6 shorthand */ 
    OR (NOT REGEX_LIKE(v, '\A(.*?[a-f0-9](:|\z)){8}', 'i') 
     AND REGEX_LIKE(v, '\A([a-f0-9]{1,4}(:[a-f0-9]{1,4}){0,6})?::([a-f0-9]{1,4}(:[a-f0-9]{1,4}){0,6})?\z', 'i')) 
    /* IPv6 dotted-quad notation, expanded */ 
    OR REGEX_LIKE(v, '\A[a-f0-9]{1,4}(:[a-f0-9]{1,4}){5}:(25[0-5]|2[0-4][0-9]|1[0-9]{2}|[1-9]?[0-9])(\.(25[0-5]|2[0-4][0-9]|1[0-9]{2}|[1-9]?[0-9])){3}\z', 'i') 
    /* IPv6 dotted-quad notation, shorthand */ 
    OR (NOT REGEX_LIKE(v, '\A(.*?[a-f0-9]:){6}', 'i') 
     AND REGEX_LIKE(v, '\A([a-f0-9]{1,4}(:[a-f0-9]{1,4}){0,4})?::([a-f0-9]{1,4}:){0,5}(25[0-5]|2[0-4][0-9]|1[0-9]{2}|[1-9]?[0-9])(\.(25[0-5]|2[0-4][0-9]|1[0-9]{2}|[1-9]?[0-9])){3}\z', 'i')) 
    ) then 

这只是测试使用IPv6。 IPv4是不允许的。

由于PL/SQL风格没有子程序调用(?n),所以除了将所有东西都展开外,别无选择。而缺乏负面预测(?!pattern)迫使我们用2个正则表达式测试操作来模拟它。

\A\z用于匹配开头和字符串的结尾,因为他们都不受标志和\z行为是下PCRE D模式一样$

+1

很好地完成! 注意:[a-f0-9]可以用[[:xdigit:]]替代,如果你疯了所有的数字,那么可读性更强(你可以省略掉我的开关) –

+0

这太棒了!这是迄今为止最接近的答案,我一直在寻找很长时间。我将测试用例添加到原始问题中。你的模式说6号是匹配的,但我被告知这不是一个有效的IPv6地址?它也在测试9和11上失败。但我不确定那些是否是有效的格式。我有另一个帖子非常类似于这个同样的事情,但也为ColdFusion(如果你想要那里点):http://stackoverflow.com/questions/21631669/regular-expression-regex-for-ipv6-与ipv4分开谢谢! – gfrobenius

+1

@gfrobenius:我不确定为什么6不是有效的IPv6。格式方面,它不应该是错的。测试9和11用于IPv6地址**前缀**,不是IPv6地址。 – nhahtdh

3

你必须从头开始清除/ iD,这是perl语法的一部分,表明它是一个正则表达式。

末我切换意味着忽略大小写,并可以作为你的REGEXP_LIKE的一个额外的参数,所以:

if (REGEXP_LIKE(v,'^(?>(?>([a-f0-9]{1,4})(?>:(?1)){7}|(?!(?:.*[a-f0-9](?>:|$)){8,})((?1)(?>:(?1)){0,6})?::(?2)?)|(?>(?>(?1)(?>:(?1)){5}:|(?!(?:.*[a-f0-9]:){6,})(?3)?::(?>((?1)(?>:(?1)){0,4}):)?)?(25[0-5]|2[0-4][0-9]|1[0-9]{2}|[1-9]?[0-9])(?>\.(?4)){3}))$','i')) the 

还有更多的问题,因为Perl的正则表达式是不等价的100%到Oracle正则表达式,我看到这里使用的patter不可用,如?> 也许你可以分开ipv4和ipv6之间的正则表达式,以避免在oracle中达到极限。而只是做REGEXP_LIKE(IP, 'ipv4pattern')或REGEXP_LIKE(IP, 'ipv6pattern')

调整上述正则表达式的东西,在甲骨文工作的IPv4部分给我:

REGEXP_LIKE(ip,'^((25[0-5]|2[0-4][0-9]|1[0-9]{2}|[1-9]?[0-9])\.){3}(25[0-5]|2[0-4][0-9]|1[0-9]{2}|[1-9]?[0-9])$','i') 
+0

啊,谢谢,我忘了标志需要在REGEXP_LIKE()调用中用逗号分隔。不幸的是,它仍然没有帮助。所有的测试都会失效。我认为@EgorSkriptunoff可能是对的。 – gfrobenius

+0

我编辑了我的帖子,在oracle中为ipv4部分包含了一个工作正则表达式。 –

+0

是的,我已经有一个单独的IPv4工作,但谢谢,我会比较你的我的。是的,我希望他们分开。但是我一直在努力寻找** IPv6 only **解决方案几个星期,但仍然找不到。这是我最初尝试找到一个:** http://stackoverflow.com/questions/21631669/regular-expression-regex-for-ipv6-separate-from-ipv4**。这里是我最近的测试用例:** http://regex101.com/r/sV5cZ3**。我仍然没有找到适用于这些测试用例的适用于'PL/SQL'的IPv6唯一正则表达式。 – gfrobenius

1
REGEXP_LIKE(ip,'^(([\dA-F]{1,4}:([\dA-F]{1,4}:([\dA-F]{1,4}:([\dA-F]{1,4}:([\dA-F]{1,4}:[\dA-F]{0,4}|:[\dA-F]{1,4})?|(:[\dA-F]{1,4}){0,2})|(:[\dA-F]{1,4}){0,3})|(:[\dA-F]{1,4}){0,4})|:(:[\dA-F]{1,4}){0,5})((:[\dA-F]{1,4}){2}|:(25[0-5]|(2[0-4]|1\d|[1-9])?\d)(\.(25[0-5]|(2[0-4]|1\d|[1-9])?\d)){3})|(([\dA-F]{1,4}:){1,6}|:):[\dA-F]{0,4}|([\dA-F]{1,4}:){7}:)\z', 'i') 

http://home.deds.nl/~aeron/regex/