computer-vision

    1热度

    2回答

    我有一个具有形状(600,400)的热图numpy数组。热图表示检测概率。就我而言,图像中人脸检测的概率。我的目标是获取这个热图,并获得发生概率最高的坐标(X和Y)。 我已经解决了这个情况的一张脸。代码如下: face_location = np.unravel_index(heatmap.argmax(), heatmap.shape) print("Face location: "

    0热度

    2回答

    我想要预测单张图片的结果,但它会给出不相关的结果。我已经训练模型上CIFAR 10集 我已经使用keras和tensorflow训练这个模型 这里是训练码要点:https://github.com/09rohanchopra/cifar10/blob/master/cifar10-simple-cnn.ipynb 代码用于预测simgle图像 # from keras.preprocessing

    1热度

    1回答

    我想找出图像的列表中出现的所有的截图,让表情符号的标签(例如,“笑脸”)。 图像列表包含所有表情符号(full list): 等等... 这是截图(show large): 截图可以有不同的分辨率和表情符号出现的高度不同。 我的想法是: 使用OpenCV的和各种过滤和遍历所有的表情符号图像在它(也许使用template matching) 用神经网络,如tensorflow,用表情符号训练自己的模

    -1热度

    2回答

    我想做一个硬币识别项目,在这个项目中,相机会拍摄一对硬币的照片,然后通过价值来识别它们,将它们总结起来并输出金额。我只是想通过查看它们的大小来识别价值(硬币越大价值越高),但我能想到的问题是,如果图片是从不同角度拍摄的,或者相机与硬币的距离与平时不同,那该怎么办?如何解决这个问题,或者有没有其他方法呢?我没有以前的图像处理经验,我想随时学习。

    4热度

    1回答

    我有一个Keras模型,它正在对Raspberry Pi(带相机)进行推理。 Raspberry Pi有一个非常慢的CPU(1.2GHz),没有CUDA GPU,所以model.predict()阶段需要很长时间(〜20秒)。我正在寻找尽可能减少这种情况的方法。我试过了: 超频CPU(+ 200 MhZ),并获得了几秒钟的性能。 使用float16而不是float32's。 尽可能减少图像输入大小

    1热度

    1回答

    有很多教程如何打印顶部检测对象与ML的图像,就像 let request = VNCoreMLRequest(model: model) { [weak self] request, error in guard let results = request.results as? [VNClassificationObservation], let topResult =

    1热度

    1回答

    我想抓取ARkit找到的原始特征点,该API公开了稀疏点云​​:https://developer.apple.com/documentation/arkit/arframe/2887449-rawfeaturepoints,并将其输出为vector_float3的列表。我还希望在这些点云坐标的每一个坐标上都有特征点的矢量表示,例如它可以是SIFT,SURF,BRIEF或任何内部使用的任意点。我可

    2热度

    1回答

    我的目标是尽量在下面的框架隔离法庭,并概述其: 我使用OpenCV进行Python和这里采取以下步骤后,我的结果: 一个给定的色相范围 开发一个位与内部的图像转换为HSV 隔离像素掩模 使用Canny边缘检测 这里是我的面具: 这里是从我的Canny边缘检测结果: 正如你看到的,我的坎尼探测器表现非常糟糕,有很多的噪音在我的面具。我尝试了一些技术,包括侵蚀和扩张,但他们没有太多帮助。 我还能做些什

    0热度

    1回答

    我有一个深度图像,点云和我有使用OpenCV功能计算的2D角点,我将如何使用深度图像计算这些角的三维位置,并且我拥有相机取证参数?

    0热度

    1回答

    我想查找作为输入给出的任何网页中特定单词的出现次数。 我使用金字塔滑动窗口,在那里我生成所有滑动窗口的HOG(梯度直方图)功能。现在,我将所有窗口的HOG特征与我想提取的单词的HOG特征进行比较。为了比较两个HOG特征向量,我只对所有的i求和(vector1(i) - vector2(i))。 但是,结果低于预期。 我的查询是,可以有一个更好的比较系统,用于比较每个窗口的HOG特征与我想查找的单词