2017-03-08 89 views
0

请帮助优化我的视图以便连接两个表,并使用整个单词列表的部分匹配。如何使用整个单词连接两个表并进行部分匹配

在附件截图中,不应列出ProductID 12和36,因为ProductName中的整个单词不是=“Mix”,而是SillMix和MixPastora。

SELECT dbo.Products.ProductID, dbo.Products.ProductName, dbo.NAMES.FullName 
FROM Products 
INNER JOIN dbo.NAMES ON dbo.Products.ProductName LIKE '%' + dbo.NAMES.FullName + '%' 

enter image description here

+0

这种类型的查询通常是有问题的。它非常需要使用字符串分隔符,以便可以隔离每个单词,然后加入字符串的一部分。这几乎总是一个迹象,表明架构中的某些东西需要改变。 –

+0

这里的男人真的很喜欢那个-1按钮。我认为这个问题不值得赞成。它有一些改进的余地,但这种类型的事情很具挑战性而且相当普遍。 –

回答

0

所以你需要全名的值作为一个整体来比较呢? 尝试改变ON条件是这样的:

dbo.Products.ProductName LIKE '%' + dbo.NAMES.FullName + '%' 

dbo.Products.ProductName LIKE '% ' + dbo.NAMES.FullName + ' %' OR 
dbo.Products.ProductName LIKE '% ' + dbo.NAMES.FullName OR  
dbo.Products.ProductName LIKE dbo.NAMES.FullName + ' %' 
+1

如果要查找的值位于字符串的开头或结尾,则这不起作用。 –

+0

你是对的,那是行不通的。 – Cobra

+0

更新后的答案呢? – jambonick

0

这里是你可以做到这一点的方法之一。我正在使用一个字符串拆分器,如果您有大量数据,可能会对性能产生严重的负面影响。这个分离器虽然非常麻烦。

这是分离器。

create FUNCTION [dbo].[DelimitedSplit8K] 
--===== Define I/O parameters 
     (@pString VARCHAR(8000), @pDelimiter CHAR(1)) 
RETURNS TABLE WITH SCHEMABINDING AS 
RETURN 
--===== "Inline" CTE Driven "Tally Table" produces values from 0 up to 10,000... 
    -- enough to cover VARCHAR(8000) 
    WITH E1(N) AS (
       SELECT 1 UNION ALL SELECT 1 UNION ALL SELECT 1 UNION ALL 
       SELECT 1 UNION ALL SELECT 1 UNION ALL SELECT 1 UNION ALL 
       SELECT 1 UNION ALL SELECT 1 UNION ALL SELECT 1 UNION ALL SELECT 1 
       ),       --10E+1 or 10 rows 
     E2(N) AS (SELECT 1 FROM E1 a, E1 b), --10E+2 or 100 rows 
     E4(N) AS (SELECT 1 FROM E2 a, E2 b), --10E+4 or 10,000 rows max 
cteTally(N) AS (--==== This provides the "zero base" and limits the number of rows right up front 
        -- for both a performance gain and prevention of accidental "overruns" 
       SELECT 0 UNION ALL 
       SELECT TOP (DATALENGTH(ISNULL(@pString,1))) ROW_NUMBER() OVER (ORDER BY (SELECT NULL)) FROM E4 
       ), 
cteStart(N1) AS (--==== This returns N+1 (starting position of each "element" just once for each delimiter) 
       SELECT t.N+1 
        FROM cteTally t 
        WHERE (SUBSTRING(@pString,t.N,1) = @pDelimiter OR t.N = 0) 
       ) 
--===== Do the actual split. The ISNULL/NULLIF combo handles the length for the final element when no delimiter is found. 
SELECT ItemNumber = ROW_NUMBER() OVER(ORDER BY s.N1), 
     Item  = SUBSTRING(@pString,s.N1,ISNULL(NULLIF(CHARINDEX(@pDelimiter,@pString,s.N1),0)-s.N1,8000)) 
    FROM cteStart s 
; 

这个分离器是由杰夫·莫恩创建和完善的社区在sql server中心。你可以在这里阅读完整的文章。 http://www.sqlservercentral.com/articles/Tally+Table/72993/

拆分器还有其他几个选项。关于替代品的最好的文章之一可以在这里找到。 https://sqlperformance.com/2012/07/t-sql-queries/split-strings

既然我们已经介绍了分离器,我们可以设置一些数据并查看它是如何工作的。

declare @Products table(ProductID int, ProductName varchar(100)) 
declare @Names table(FullName varchar(100)) 

insert @Products (ProductID, ProductName) values 
(52, 'Filo Mix') 
, (36, 'Inagd SillMix') 
, (2, 'Mix Chang') 
, (12, 'Queso Manchego La MixPastora') 

insert @Names 
select 'Mix' 

SELECT p.ProductID 
    , p.ProductName 
    , n.FullName 
FROM @Products p 
INNER JOIN @Names n ON p.ProductName LIKE '%' + n.FullName + '%' 
cross apply dbo.DelimitedSplit8K(p.ProductName, ' ') x 
where x.Item = n.FullName 
相关问题