2016-12-01 56 views
0

Ex。T-SQL:将字符串分成多列

Column 1: 
| word1 word2 word3 word4 | 

Col 1: Col 2: Col 3: Col 4: 
| word1 | word2 | word3 | word | 

是否有可能不同的单词或短语从一个字符串为多列分开?字符串中的所有单词和短语通常由双空格分隔,没有别的。是否有预定义的函数可以从SQL Server中使用,例如CAST或INTERSECT,还是必须自己编写?

回答

0

这里是一个动态的SQL版本。约翰的情况下,如果你不知道最大的单词数量。实现你想要的关键技术将是拆分字符串和数据透视(或条件聚合)。因为你有两种做法,约翰的方法是一个很好的捷径。

IF OBJECT_ID('tempdb..#TblName') IS NOT NULL 
    BEGIN 
     DROP TABLE #TblName 
    END 

CREATE TABLE #TblName (
    ID INT IDENTITY(1,1) 
    ,String VARCHAR(500) 
) 

INSERT INTO #TblName VALUES ('word1 word2 word3 word4'),('abcd efgh ijkl') 

DECLARE @NumWords INT 

SELECT @NumWords = ISNULL(MAX((LEN(String) - LEN(REPLACE(String,' ','')))/2 + 1), 0) 
FROM 
    #TblName 

DECLARE @i INT = 1 
DECLARE @SQL NVARCHAR(MAX) 

SET @SQL = ' 
SELECT 
    t.Id 
    ,t.String 
    ,c.* 
FROM 
    #TblName t 
    CROSS APPLY (
     SELECT 

      ' 
WHILE @i <= @NumWords 
BEGIN 
    SET @SQL = @SQL 
      + IIF(@i > 1,', ','') 
      + 'Column' + CAST(@i AS NVARCHAR(MAX)) + '1 = x.value (''/x[' + CAST(@I AS NVARCHAR(MAX)) + ']'',''varchar(max)'')' 

    SET @i = @i + 1 
END 

SET @SQL = @SQL + ' 
     FROM 
      (SELECT CAST(''<x>'' + REPLACE(String,'' '',''</x><x>'') + ''</x>'' as XML) x) a 
    ) c' 


EXECUTE (@SQL) 
+0

最大的列数是4,所以总是有4列,但是如果一个字符串只有3个字,那么只有3个新列将用于该行。你的函数非常好,但是我可以输入列名作为插入的值,还是必须一个一个地写下每个单词?原始列中的每一行对于每一行都有一组不同的单词,并且有时单词每天或每周都会更改,因此我无法每次都重新输入所有单词,因此有没有办法使您的函数能够从原始专栏? –

+0

如果最多有4列,我会使用约翰的答案,因为这将是矫枉过正。我不会按照你的意思写下每个单词,因为这些作品会自动分割出来。你可能会被抛弃,因为我给列命名为word1,word2等。所以我只是更新并将其更改为Column,希望能够消除混淆。 – Matt

1

在CROSS APPLY和一些XML的帮助下。易于扩展和/或合同

Declare @YourTable table (id int,Column1 varchar(max)) 
Insert Into @YourTable values 
(1,'word1 word2 word3 word4'), 
(2,'some other words') 

Select A.ID 
     ,B.* 
From @YourTable A 
Cross Apply (
     Select Pos1 = xDim.value('/x[1]','varchar(max)') 
       ,Pos2 = xDim.value('/x[2]','varchar(max)') 
       ,Pos3 = xDim.value('/x[3]','varchar(max)') 
       ,Pos4 = xDim.value('/x[4]','varchar(max)') 
       ,Pos5 = xDim.value('/x[5]','varchar(max)') 
       ,Pos6 = xDim.value('/x[6]','varchar(max)') 
       ,Pos7 = xDim.value('/x[7]','varchar(max)') 
       ,Pos8 = xDim.value('/x[8]','varchar(max)') 
       ,Pos9 = xDim.value('/x[9]','varchar(max)') 
     From (Select Cast('<x>' + Replace(A.Column1,' ','</x><x>')+'</x>' as XML) as xDim) A 
     ) B 

返回

enter image description here

+0

这非常好,但问题是我没有定义单词列表;原始列有多行,每行都有不同的字符串,并且我不能逐个写下每个字符串,因此函数需要自动执行,尤其是因为字符串可能与每个帐户不同,并且每天都会更改。有没有办法让你的函数更具动态性,所以它可以运行多个变量? –

+0

@ K.Ventura(at)YourTable是一个演示表变量。用您的实际表名和A.Column1替换(在)YourTable与您的实际字段名称,它将运行。当你说动态到底在找什么时, –

0

如果字数不固定numbr,您可以使用动态脚本,但这真是一个样本:

IF OBJECT_ID('tempdb..#tb') IS NOT NULL DROP TABLE #tb 
CREATE TABLE #tb (id int,Column1 varchar(max)) 
insert Into #tb values 
(1,'word1 word2 word3 word'), 
(2,'w1 w2 w3 w4 w5 w6') 

DECLARE @Cols NVARCHAR(max),@sql nvarchar(MAX) 
DECLARE @MaxWordCount INT 
SELECT @MaxWordCount=MAX(LEN(t.Column1)-len(replace(t.Column1,' ',''))+1) from #tb as t 
    SELECT @Cols=ISNULL(@Cols+',','')+'[Col '+LTRIM(sv.number)+']' FROM master.dbo.spt_values as sv WHERE sv.Type='P' and sv.number BETWEEN 1 AND @MaxWordCount 

PRINT @Cols 
SET @sql='SELECT * from (
      SELECT t.*, w.* FROM #tb AS t 
      CROSS APPLY (VALUES (convert(XML, ''<n>'' + replace(t.Column1, '' '', ''</n><n>'') + ''</n>''))) x(c) 
      CROSS APPLY (SELECT ''Col '' + ltrim(row_number()OVER (ORDER BY getdate())) AS col 
           ,s.b.value(''.'', ''varchar(200)'') AS wd 
          FROM x.c.nodes(''n'') s(b)) w 
     ) a PIVOT (max(wd) for col in ('[email protected]+')) p' 
PRINT @sql 
EXEC(@sql) 
IF OBJECT_ID('tempdb..#tb') IS NOT NULL DROP TABLE #tb 
 
id Column1 Col 1 Col 2 Col 3 Col 4 Col 5 Col 6 
2 w1 w2 w3 w4 w5 w6 w1 w2 w3 w4 w5 w6 
1 word1 word2 word3 word word1 word2 word3 word NULL NULL 
0

这个怎么样?

Create Table AllData (Column0 varchar(500)) 
Insert Into AllData Values ('word1 word2 word3 word4') 
Select parsename(replace(replace(replace([Column0],' ',' '),' ',' '),' ','.'), 4) [Col1], 
parsename(replace(replace(replace([Column0],' ',' '),' ',' '),' ','.'), 3) [Col2], 
parsename(replace(replace(replace([Column0],' ',' '),' ',' '),' ','.'), 2) [Col3], 
parsename(replace(replace(replace([Column0],' ',' '),' ',' '),' ','.'), 1) [Col4] 

from AllData