2016-11-20 100 views
0

SED问题SED多个搜索条目

我需要打印11月份包含11或12月份12的任何行。

我的两个问题是:

  1. 如何寻找多个项目I.E.打印11和12的值?
  2. 如何让搜索查看包含日期的第4列?

我到目前为止有:

sed -n -e '/11/,/12/p' datebook 

文件datebook

Steve Blenheim:238-923-7366:95 Latham Lane, Easton, PA 83755:11/12/56:20300 
Betty Boop:245-836-8357:635 Cutesy Lane, Hollywood, CA 91464:6/23/23:14500 
Igor Chevsky:385-375-8395:3567 Populus Place, Caldwell, NJ 23875:6/18/68:23400 
Norma Corder:397-857-2735:74 Pine Street, Dearborn, MI 23874:3/28/45:245700 
Jennifer Cowan:548-834-2348:583 Laurel Ave., Kingsville, TX 83745:10/1/35:58900 
Jon DeLoach:408-253-3122:123 Park St., San Jose, CA 04086:7/25/53:85100 
Karen Evich:284-758-2857:23 Edgecliff Place, Lincoln, NB 92086:7/25/53:85100 
Karen Evich:284-758-2867:23 Edgecliff Place, Lincoln, NB 92743:11/3/35:58200 
Karen Evich:284-758-2867:23 Edgecliff Place, Lincoln, NB 92743:11/3/35:58200 
Fred Fardbarkle:674-843-1385:20 Parak Lane, DeLuth, MN 23850:4/12/23:780900 
Fred Fardbarkle:674-843-1385:20 Parak Lane, DeLuth, MN 23850:4/12/23:780900 
Lori Gortz:327-832-5728:3465 Mirlo Street, Peabody, MA 34756:10/2/65:35200 
Paco Gutierrez:835-365-1284:454 Easy Street, Decatur, IL 75732:2/28/53:123500 
Ephram Hardy:293-259-5395:235 CarltonLane, Joliet, IL 73858:8/12/20:56700 
James Ikeda:834-938-8376:23445 Aster Ave., Allentown, NJ 83745:12/1/38:45000 
Barbara Kertz:385-573-8326:832 Ponce Drive, Gary, IN 83756:12/1/46:268500 
Lesley Kirstin:408-456-1234:4 Harvard Square, Boston, MA 02133:4/22/62:52600 
William Kopf:846-836-2837:6937 Ware Road, Milton, PA 93756:9/21/46:43500 
Sir Lancelot:837-835-8257:474 Camelot Boulevard, Bath, WY 28356:5/13/69:24500 
Jesse Neal:408-233-8971:45 Rose Terrace, San Francisco, CA 92303:2/3/36:25000 
Zippy Pinhead:834-823-8319:2356 Bizarro Ave., Farmount, IL 84357:1/1/67:89500 
Arthur Putie:923-835-8745:23 Wimp Lane, Kensington, DL 38758:8/31/69:126000 
Popeye Sailor:156-454-3322:945 Bluto Street, Anywhere, USA 29358:3/19/35:22350 
Jose Santiago:385-898-8357:38 Fife Way, Abilene, TX 39673:1/5/58:95600 
Tommy Savage:408-724-0140:1222 Oxbow Court, Sunnyvale, CA 94087:5/19/66:34200 
Yukio Takeshida:387-827-1095:13 Uno Lane, Ashville, NC 23556:7/1/29:57000 
Vinh Tranh:438-910-7449:8235 Maple Street, Wilmington, VM 29085:9/23/63:68900 
+1

这个网站是国际化的:它会以及到状态出现在第4栏的日期采用美式月/日/年的格式。我还看到,人们在通过Y2K危机时打瞌睡;真的没有理由不存储全年的所有4位数字。 –

+0

看看http://unix.stackexchange.com/questions/145402/regex-alternation-or-operator-foobar-in-gnu-or-bsd-sed – BadZen

回答

0

看来,要选择在那里就行了第三个冒号后的第一个字符是11/线或12/(因为数据格式显示为带有mm/dd/yy表示法的Y2K格式的美式格式日期)。所以你写:

$ sed -n '/^\([^:]*:\)\{3\}1[12]\//p' datebook 
Steve Blenheim:238-923-7366:95 Latham Lane, Easton, PA 83755:11/12/56:20300 
Karen Evich:284-758-2867:23 Edgecliff Place, Lincoln, NB 92743:11/3/35:58200 
Karen Evich:284-758-2867:23 Edgecliff Place, Lincoln, NB 92743:11/3/35:58200 
James Ikeda:834-938-8376:23445 Aster Ave., Allentown, NJ 83745:12/1/38:45000 
Barbara Kertz:385-573-8326:832 Ponce Drive, Gary, IN 83756:12/1/46:268500 
$ 

^匹配在一行的开始; \([^:]*]:\)部分查找一系列零个或多个非冒号,后跟一个冒号; \{3\}需要3个;在那之后1[12]\/要求11/12/;打印p

我注意到最初的说法是'11月11日或12月12日',但你的第一个编号问题说'价值11和12'。这些是矛盾的;一个给定的日期字段只能以其中一个开头,而不是两个。我认为'或'是你的意图。

+0

是的,或者是我的意思。这工作完美..谢谢你的解释。 – TonyD

1

我该如何告诉查找第4列哪些日期?

这是你应该使用awk因为sed没有领域的概念的指示。一个awk的解决办法是

awk -v FS=":" '$4 ~ /^1[12]\/.*/{print}' datebook 

输出

Steve Blenheim:238-923-7366:95 Latham Lane, Easton, PA 83755:11/12/56:20300 
Karen Evich:284-758-2867:23 Edgecliff Place, Lincoln, NB 92743:11/3/35:58200 
Karen Evich:284-758-2867:23 Edgecliff Place, Lincoln, NB 92743:11/3/35:58200 
James Ikeda:834-938-8376:23445 Aster Ave., Allentown, NJ 83745:12/1/38:45000 
Barbara Kertz:385-573-8326:832 Ponce Drive, Gary, IN 83756:12/1/46:268500 

破译溶液

  • FS=":"设置字段/列分隔符来结肠。
  • $4代表在输入文件列其中四个是在格式的日期mm/dd/yy
  • $4 ~ /^1[12]\/.*/~意味着我们做一个正则表达式匹配,其中
    • ^表示字符串的开头
    • [12]可以匹配一个或两个。
    • 由于正则表达式部分本身是由/分隔你需要逃避任何文字/\/