snappydata

    1热度

    1回答

    我正在测试新的应用程序的数据库,我将不得不浏览和索引数百万个xml文件并随后生成这些数据的分析。 我会在这个项目中使用SnappyData。但是,我不知道它是如何工作的。 建议这种类型的应用程序? 是否可以与Spring-Data-JPA一起使用它? 除了存储xmls本身之外,我还希望将应用程序的其他数据(用户和系统设置)存储在同一个数据库中而不是PostgreSQL中。是否推荐?

    1热度

    1回答

    我对S3兽人数据的1.2GB,我试图做同样的下列内容: 1)高速缓存活泼的群集上的数据[snappydata 0.9] 2)上的高速缓存的数据集 3)比较用火花的性能执行一个查询GROUPBY 2.0.0 我使用的是64 GB/8芯机和用于斯纳皮配置集群如下: 012现在 $ cat locators localhost $cat leads localhost -heap-size=40

    1热度

    1回答

    我是SnappyData的新手,我试图将大量数据导入到它中。因此,数据是从不同的来源创建的,并作为csv文件存储在每个位置的zip文件中。可以说,拉链的结构是zip1,zip2 ... zipn,每个zip包含完全相同的(header.csv,detail1.csv,detail2.csv,... detail15.csv)每个.csv具有相同的结构,这意味着zip1中的detail5.csv与z

    0热度

    1回答

    当我创建一个新的数据库并从Postgresql导入架构结构到SnappyData我正在处理有关如何使用来替换每个数据类型的问题。 首先使用什么来兼容具有时间戳,真实,双倍,长(坐标)和字符串的数据? 我搜索的帮助和文档,但没有找到关于它的一个很好的解释...

    1热度

    1回答

    SnappyData文档就如何提交一个罐子到群集的例子: https://snappydatainc.github.io/snappydata/howto/run_spark_job_inside_cluster/ 但是,如果我需要与同一类CreatePartitionedRowTable 提交罐子什么多次,但有不同的参数,说不同的后缀追加到创建的表名称,我该怎么做? UPDATE: 更确切地说,

    0热度

    1回答

    我有我需要连接两个表 table_A(ID, val), table_B(ID, val) 得到一个新表 RESULT(ID, value) 当值应填入这样 案例1:如果在table_A和table_B中都存在一个ID,值应该是1, 情况2:如果ID仅存在于标签中le_A并且不存在于表-B,值应为0 CREATE TABLE RESULT AS SELECT A.ID, {TODO}

    1热度

    2回答

    我正尝试使用Zeppelin创建SnappyData流表。 我与参数 'rowConverter' 齐柏林笔记本流表定义的问题被分为几段: 第1款: import org.apache.spark.sql.Row import org.apache.spark.sql.streaming.{SchemaDStream, StreamToRowsConverter} class RowsCon

    0热度

    2回答

    我想从snappydata cli运行jar文件。 我只想在开始时创建sparkSession和SnappyData会话。 package io.test import org.apache.spark.sql.{SnappySession, SparkSession} object snappyTest { def main(args: Array[String]) {

    0热度

    1回答

    我有一个包含数百万条记录的列表。我只想保留最近3个月的内存,其余的需要在磁盘上,但可以咨询。 SnappyData可以做到这一点吗?

    0热度

    1回答

    我试图通过智能连接器样式连接到SnappyData存储,如http://snappydatainc.github.io/snappydata/howto/#how-to-access-snappydata-store-from-an-existing-spark-installation-using-smart-connector中的描述,但得到了由java.nio引起的com.gemstone.