h5py

    0热度

    1回答

    例如,我希望有两个数据集,一个是Input,另一种是Output 在Input的数据和Output是多变暗。 如 但我在h5py,input_node和output_node注意是固定的。 Input = f.create_dataset('Input', (3,input_node),dtype='float', chunks=True) Output = f.create_dataset('

    0热度

    1回答

    我有一个问题,计算numpy中的数组的平均值,对RAM(〜100G)来说太大。 我已经研究过使用np.memmap,但不幸的是我的数组被存储为HDF5文件中的数据集。根据我的尝试,np.memmap不接受hdf5数据集作为输入。 TypeError: coercing to Unicode: need string or buffer, Dataset found 那么我怎样才能以高效的方式在磁盘

    3热度

    1回答

    我正在使用R 3.4.2。我下面从decryptrpackage library(decryptr) # Download captchas captcha <- download_tjmg(dest = 'img') keras_tjmg <- decryptrModels::read_model('tjmg') 最后的代码行例如产生一个错误 Error in keras::load

    2热度

    2回答

    我试图从许多HDF5文件中提取值并将其存储在列表中。 import h5py h = [h5py.File('filenum_%s.h5' % (n),'r')['key'][10][10] for n in range(100)] 这个列表解析包含从HDF5文件filenum0.h5 'key' 的阵列中的网格点(10,10)的值 - filenum99.h5。 它的工作原理,但它停止与周

    1热度

    1回答

    我一直在使用SMAP数据卫星,专门用于湿度和土壤比例。 我按照使用的想法GDAL解决一切,并与此类似刊登在Link to first approach to download SMAP data 对矫正代码和测试的东西: import os import h5py import numpy as np from osgeo import gdal, gdal_array, osr

    1热度

    1回答

    我有具有3点矩阵A,B,C. 其实我使用scipy.io到如下导入此垫文件.MAT文件导入.MAT-7.3版文件。 data = sio.loadmat('/data.mat') A = data['A'] B = data['B'] C = data['C'] 但是,v7.3文件不能使用这种方式导入。 所以,我试图导入使用h5py,但我不知道如何使用h5py。 我的代码如下。 f =

    0热度

    2回答

    我似乎无法得到此工作。所有的例子和线程都有人创建新的数据集。我只想更新已经创建的数据集中的一个字段。 以下是我有: h5_file = h5py.File(event_file_path, "r+") #this works event_processing_status = int(h5_file[PATH][STATUS].value[0]['Status']) #this works

    0热度

    1回答

    我正在尝试将数据保存到.h5文件。数据格式是一些这样的事: [(1, array([[ 1., 1., 1., 1.]]), 64, 64), (2, array([[ 1., 1., 1., 1.]]), 64, 64), (3, array([[ 1., 1., 1., 1.]]), 64, 64), (4, array([[ 1., 1., 1., 1.]]), 64, 64)]

    0热度

    1回答

    我从HDF5文件中提取numpy数据(所有非零浮点数),然后将其转换为熊猫数据帧,然后尝试显示数据里面,但这是失败的。我在Jupyter笔记本上做了所有这些。 import h5py # necessary for storing import pandas as pd from IPython.display import display, HTML h5 = h5py.File('so

    0热度

    1回答

    我有一个相对较大的数据集(大约8GB),并使用h5py将其读入jupyter笔记本中。 数据集的形状最终变成类似(50000000,384)的形状。我的理想数据集会进行转置,以便我可以查看数据集中的每个“列”。我能够实现获取每列的唯一方法是对每列进行索引(这非常缓慢且CPU密集型,因为它在50000000行中逐行进行)或将h5数据转换为np.array并转置 - 这也非常缓慢和无效。 例如,我有一