基础集成技术

1、最大投票法(Max Voting)

        最大投票方法通常用于分类问题。这种技术中使用多个模型来预测每个数据点。每个模型的预测都被视为一次“投票”。大多数模型得到的预测被用作最终预测结果。

即:少数服从多数(voting=’hard’)

# 导入依赖
from sklearn.ensemble import VotingClassifier

# 初始化模型
model1 = LogisticRegression(random_state=1)
model2 = tree.DecisionTreeClassifier(random_state=1)
model3= LogisticRegression(random_state=1)

# 集成学习
model = VotingClassifier(estimators=[
            ('lr', model1), 
            ('dt', model2),
            ('lg', model3)], voting='hard')

# 开始集成训练
model.fit(x_train,y_train)

# 开始集成测试
model.score(x_test,y_test)

2、平均法(Averaging)

        对每个数据点的多次预测进行平均。在这种方法中,我们从所有模型中取平均值作为最终预测。平均法可用于在回归问题中进行预测或在计算分类问题的概率时使用。

model1 = tree.DecisionTreeClassifier()
model2 = KNeighborsClassifier()
model3= LogisticRegression()

model1.fit(x_train,y_train)
model2.fit(x_train,y_train)
model3.fit(x_train,y_train)

pred1=model1.predict_proba(x_test)
pred2=model2.predict_proba(x_test)
pred3=model3.predict_proba(x_test)

finalpred=(pred1+pred2+pred3)/3

或者

# 导入依赖
from sklearn.ensemble import VotingClassifier

# 初始化模型
model1 = LogisticRegression(random_state=1)
model2 = tree.DecisionTreeClassifier(random_state=1)
model3= LogisticRegression(random_state=1)

# 集成学习
model = VotingClassifier(estimators=[
            ('lr', model1), 
            ('dt', model2),
            ('lg', model3)], voting='soft', weights=[5,5,5])

# 开始集成训练
model.fit(x_train,y_train)

# 开始集成测试
model.score(x_test,y_test)

3、加权平均法(Weighted Average)

        为所有模型分配不同的权重,定义每个模型的预测重要性。 

# 初始化模型
model1 = tree.DecisionTreeClassifier()
model2 = KNeighborsClassifier()
model3= LogisticRegression()

# 分别训练模型
model1.fit(x_train,y_train)
model2.fit(x_train,y_train)
model3.fit(x_train,y_train)

# 模型预测
pred1=model1.predict_proba(x_test)
pred2=model2.predict_proba(x_test)
pred3=model3.predict_proba(x_test)

# 求加权
finalpred=(pred1*0.3+pred2*0.3+pred3*0.4)

或者 

# 导入依赖
from sklearn.ensemble import VotingClassifier

# 初始化模型
model1 = LogisticRegression(random_state=1)
model2 = tree.DecisionTreeClassifier(random_state=1)
model3= LogisticRegression(random_state=1)

# 集成学习
model = VotingClassifier(estimators=[
            ('lr', model1), 
            ('dt', model2),
            ('lg', model3)], voting='soft', weights=[3,3,4])

# 开始集成训练
model.fit(x_train,y_train)

# 开始集成测试
model.score(x_test,y_test)

文章出处登录后可见!

已经登录?立即刷新

共计人评分,平均

到目前为止还没有投票!成为第一位评论此文章。

(0)
心中带点小风骚的头像心中带点小风骚普通用户
上一篇 2022年5月24日
下一篇 2022年5月24日

相关推荐