我有产品说明,家具,很多字,我需要找到产品的大小(尺寸)。问题是,尺寸描述的格式并不总是相同的。只有一样东西保持不变:数字之间用“x”表示,如果文本中有“x”,而另外一个“x”只有几个字符,则肯定是大小描述。爪哇找不到那么具体字符串
大小描述/所有这些出现的可能的格式/:
尺寸:110x76x60厘米/不带空格/
尺寸:150×64,5×200厘米/与空间/
尺寸:L90 X H55 X W60厘米/长度,高度,宽度/
尺寸:149×V110 X H40 /只的一些数字面前有/
也不要说,这些数字不必须是3位数字字母,他们可以只2位数字。
但是,如果仅仅为了一种格式而更容易做到这一点,我就把它拿来:),然后让程序一次又一次地检查整个列表中所有可能的格式。
为OP作为额外的帮助,这里是一个例如:https://regex101.com/r/tSaBhy/1 – Andreas
到目前为止,我不知道。 :)到目前为止,我唯一的建议是查找字符串“size:”,但是当我不知道何时停止解析文本时,它没有任何提示 - 大小描述并不总是以“cm”结尾。 – nilrem
安德烈亚斯,圣牛:)看起来有趣,我会研究它,到目前为止我不知道发生了什么事。 :) – nilrem