2016-09-27 30 views
0

CSV文件我有询问与头一个CSV文件这样的问题:我怎样才能做一个查询使用头文件与Apache钻

ID, NOMBRE, APELLIDOS, PROVINCIA 
12121212, MARIA, LIONZA, MADRID 
12312312, JAIMITO, PEREZ, ALMERÍA 
13131313, BRUNO, DIAZ, MALAGA 
23423423, HARLEY, QUINN, BARCELONA 

我这样做了阿帕奇钻UI V1。 8。 当执行以下查询时
SELECT * FROM dfs。' 文件路径 /clientes.csv”它完美的作品,它返回一个像这样的表: enter image description here

但是,如果我做一个查询指定的列名(CSV文件的标题),那么一些列空的任何理由我还没有想出来,并正在让我疯狂 pe此查询
SELECT ID,NOMBRE FROM dfs。' 文件路径 /clientes.csv”

返回此

enter image description here

而且我编辑的DFS插件和附加属性extractHeader为true

... 
"csv": { 
     "type": "text", 
     "extensions": [ 
     "csv" 
     ], 
     "extractHeader": true, 
     "delimiter": "," 
    }, 
... 

我做那么什么错?为什么我可以通过ID查询,但不能通过NOMBRE或PROVINCIA等其他字段(标题名称)查询。你有什么主意吗?

回答

0

看起来像一个错误。

删除“从dfs插件extractHeader

... 
"csv": { 
     "type": "text", 
     "extensions": [ 
     "csv" 
     ], 
     "delimiter": "," 
    }, 
... 

,并与较老的方法试图

select columns[0] as id ,columns[1] as NOMBRE from `a.csv`; 

输出:。

+-----------+-----------+ 
| id  | NOMBRE | 
+-----------+-----------+ 
| ID  | NOMBRE | 
| 12121212 | MARIA | 
| 12312312 | JAIMITO | 
| 13131313 | BRUNO | 
| 23423423 | HARLEY | 
+-----------+-----------+ 

工作正常

+0

thx为你的答案,但这就是我想避免我只是想通过标题名称引用列 – Joseratts

+0

@Joseratts你可以询问关于此钻[社区](https://drill.apache.org/邮件列表/)([email protected]),如果演练人员确认这一点,您可以将其作为JIRA上的错误提升。 –

1

我相信你遇到的问题是由于标题字段中的空格造成的。

为了验证这一假说,尝试此查询(请注意空格和后列名蜱):

SELECT `ID `, `NOMBRE ` FROM <your file> 

最简单的解决方法是去除头部空间。

+0

你说得对。有效! – Joseratts

相关问题