2017-03-16 27 views
0

我想要的野蔷薇得分比较在Azure的ML工作室两个分类:比较荆棘的成绩。Azure的ML分类

import pandas as pd 
import numpy as np 
from sklearn.metrics import brier_score_loss 

def azureml_main(dataframe1, dataframe2): 
    colnames_1 = dataframe1.columns 
    y_true_1 = np.array(dataframe1[colnames_1[1]]) 
    y_prob_1 = np.array(dataframe1[colnames_1[-1]]) 
    brier_score_1 = brier_score_loss(y_true_1, y_prob_1) 

    colnames_2 = dataframe2.columns 
    y_true_2 = np.array(dataframe2[colnames_2[1]]) 
    y_prob_2 = np.array(dataframe2[colnames_2[-1]]) 
    brier_score_2 = brier_score_loss(y_true_2, y_prob_2) 

    data = {'brier_score': [brier_score_1, brier_score_2]} 
    result = pd.DataFrame(data, columns=['brier_score']) 

    return result 

我的问题是,该脚本只输出第一行用一个值第一个数据集的brier得分。第二行是空的。这是我如何连接脚本: azure

+1

我回顾了'brier_score_loss'方法的引用,并试图重现您的问题,但失败了,因为我可以得到有两行的结果。第二行似乎不可能消失,即使不是南/无值。你能发布一些样本数据来帮助分析这个问题吗?谢谢。 –

+0

感谢您看看它。我已经联系了Azure开发人员支持。他们正在看看它。我会让你知道他们发现了什么。 – Wessi

回答

0

我发现问题是由第二个数据帧中的几个NaN值造成的。 将dataframe2 = dataframe2.dropna()添加到脚本的顶部解决了问题。