当前位置: 首页 > >

Sklearn数据预测

发布时间:

Sklearn预测未来趋势

这里就不多赘述了,预测问题需要根据历史数据来预测未来,因此我们将数据进行切分,历史数据用来训练,未来数据用来预测,直接上!!!


读取数据!


data1 = pd.read_excel("python导学课数据/切分数据/历史购买数据.xlsx")
data2 = pd.read_excel("python导学课数据/切分数据/需要预测数据.xlsx")

进一步来熟悉下数据,我们是根据“商品价格水*”、用户“年龄水*”和“和商铺评分”来预测“用户是否购买”,换句话说,前者相当于是自变量,后者相当于是因变量!

这里的预测采用线性模型逻辑回归进行!


from sklearn.linear_model import LogisticRegression
model = LogisticRegression() # 创建模型
model.fit(data1[["商品价格水*", "用户年龄水*", "商铺评分"]], data1["用户是否购买"]) # 训练模型

这里就不过多进行说明了, 这个对于初学者来说应该也很容易理解了!输出以下内容说明模型训练完成了!

接下来就是采用训练好的模型进行预测!此处注意预测时不需要输入数据“用户是否购买”!!!


pred = model.predict(data2[["商品价格水*", "用户年龄水*", "商铺评分"]])

得到以下输出证明模型预测完成,这里边有0和1,表示购买和不购买!

接下来需要对预测结果进行评价了!输入数据为用户购买情况的真实数据和预测数据!


from sklearn.metrics import accuracy_score
accuracy_score(data2["用户是否购买"], pred)

得到结果为

到此,预测也就完事了!干杯!



友情链接: