4

我的图像数据集来自http://www.image-net.org。有不同的事物,如植物群,动物群,人等
我必须训练一个分类器,预测1如果图像属于花卉synset和0,否则。
通过点击左窗格中的植物,植物区系,植物生命选项,可以在http://www.image-net.org/explore上查看属于花卉synset的图像。

图像中的自动植物区系检测

这些图像包括各种菌群 - 像树木,草本植物,灌木,花卉等 我无法弄清楚什么功能使用训练分类。这些图像中有很多绿色植物,但有许多花朵图像,这些图像没有太多绿色成分。另一个特征是叶子和花瓣的形状。

如果有人可以建议如何提取此形状特征并使用它来训练分类器将是有帮助的。还建议可以使用其他功能来训练分类器。
提取特征后,哪种算法将用于训练分类器?

+2

应该被迁移到dsp.stackexchange.com –

回答

4

不确定形状信息是您链接到的数据集的方法。

只要有一个快速浏览一下一些图片我有分类的几点建议:

  1. 自然场景很少有直线 - 直线检测
  2. 可以优惠,其具有的“不自然的大片场景“他们的颜色。
  3. 如果你想尝试更先进的东西,我会建议熵/模式识别之间的混合将形成一个很好的分类器,因为自然场景有很多两者。
  4. 尝试模板匹配/叶子/花瓣的形状匹配会破坏你的心 - 你需要使用更广义的东西。

至于其分类使用......我通常最初建议K-手段,一旦你有一些结果确定是否额外的努力来实现贝叶斯或者神经网络将是值得的。

希望这会有所帮助。

T.

扩展:

“不自然的颜色” 可以被高度饱和的绿色和棕色的领域以外的颜色。它们适用于检测自然场景,因为即使花在花的中心,绿/棕色光谱中应该有〜50%的场景。

此外,直线检测应该在自然场景中产生很少的结果,因为直线边缘在自然界中很少见。在基本水平上生成一个边缘图像,阈值,然后搜索线段(近似直线的像素)。

熵需要一些机器视觉知识。你可以通过确定本地化的entropys来处理场景,然后直方图结果here是一个类似的方法,你将不得不使用。

如果您要尝试模式识别,您将希望在机器视觉方面取得进步,因为这是一个困难的主题,而不是您可以在代码示例中抛出的东西。我只尝试将颜色和边缘信息(线条)用尽后,将它们作为分类器来实现。

如果这是一个商业应用,那么应该咨询MV专家。如果这是一项大学任务(除非是论文),颜色和边缘/线条信息应该足够。

+0

安德烈也是对的。数字信号处理堆栈是这类问题的热门场所。 – Totero

+0

如何检测“不自然的颜色”?我如何从熵/模式识别开始?给定一个新图像,分类器应该能够检测图像中是否有花卉内容。 – gourav

+0

这是一个大学项目。谢谢。我正在探索熵/模式识别。如果您知道有一些很好的资源可以从熵/模式识别开始,请发布它们。 – gourav

0

HOOG我认为功能几乎是这类问题的事实上的标准。他们有点参与计算(我不知道你在哪个环境工作),但功能强大。

一个更简单的解决方案可能会启动并运行,具体取决于数据集的难度,是从图像中提取所有重叠的补丁,使用k-means(或任何您喜欢的)将它们聚类,然后表示图像作为这类量化图像补丁的分布,用于像SVM这样的监督分类器。你会惊奇地发现,这样的工作经常会起作用,它至少应该提供一个有竞争力的基准线。