多元线性回归数据集(50_Startups.csv)及代码实现

大怪科学 20230807

  • 线性回归
  • 数据处理
  • 虚拟变量

知识点离散数据的处理

若数据存在“序”关系则连续化,如:

离散 连续
高/m 高
10 1
5 0.5
1 0

否则,转为K维向量代码可见本实例中的Pd.get_dummies(X['state'])。但要注意虚拟变量,例如“性别”变量,可虚拟出“男”和”女”两个变量,

男 1 0
女 0 1

这里所说的虚拟变量陷阱是两个或多个变量高度相关的情况,简单地说,一个变量可以从其他变量中预测出来,那么这里就有一个重复的类别,可以去掉一个变量,节约内存计算机内存空间,减少计算量。

本实例用的数据集是50_Startups.csv,

代码如下:

importnumpyasnp
pipinstallmatplotlib
importmatplotlib.pyplotasplt
importpandasaspd
dataset=pd.read_csv("D:/python/50.csv")
X=dataset.iloc[:,0:4]#0到3列的所有行数据(共4列)
X["State"].unique()
y=dataset.iloc[:,4]#第5列的所有行数据
pd.get_dummies(X['State'])#离散数据转为K维向量
statesdump=pd.get_dummies(X['State'],drop_first=True)#去掉X['State']的第一列数据(减少虚拟变量)
X=X.drop('State',axis=1)
X=pd.concat([X,statesdump],axis=1)
from sklearn.model_selection import train_test_split
x_train,x_test,y_train,y_test=train_test_split(X,y,test_size=0.3,random_state=0)
x_train
#引入线性回归模型拟合训练集
from sklearn.linear_model import LinearRegression
regressor=LinearRegression()
model=regressor.fit(x_train,y_train)
#预测测试集的结果
y_predict=regressor.predict(x_test)
from sklearn.metrics import r2_score# 
score1=r2_score(y_test,y_predict)
model.coef_#多元函数的系数
model.intercept_#函数的截距
model.score(X,y)





审核编辑:刘清

查看全文

点赞

大怪科学

作者最近更新

  • Aigtek功率放大器在传感器测试领域研究中的应用
    大怪科学
    2天前
  • 泰科电子座椅位置传感器如何实现可靠保护
    大怪科学
    2天前
  • 中微爱芯推出高精度零漂移运算放大器AiP856X系列
    大怪科学
    4天前

期刊订阅

相关推荐

  • 如何实现物联网的融合和互操作性?

    2025-08-23

  • 为什么边缘计算对物联网战略来说很重要

    2020-03-16

  • 总投资约1.7亿 “中国天眼”数据中心将落地建设

    2020-04-15

  • 以前要24小时的基因组测序 中国团队只用了7分钟

    2022-03-04

评论0条评论

×
私信给大怪科学

点击打开传感搜小程序 - 速览海量产品,精准对接供需

  • 收藏

  • 评论

  • 点赞

  • 分享

收藏文章×

已选择0个收藏夹

新建收藏夹
完成
创建收藏夹 ×
取消 保存

1.点击右上角

2.分享到“朋友圈”或“发送给好友”

×

微信扫一扫,分享到朋友圈

推荐使用浏览器内置分享功能

×

关注微信订阅号

关注微信订阅号,了解更多传感器动态

  • #{faceHtml}

    #{user_name}#{created_at}

    #{content}

    展开

    #{like_count} #{dislike_count} 查看评论 回复

    共#{comment_count}条评论

    加载更多

  • #{ahtml}#{created_at}

    #{content}

    展开

    #{like_count} #{dislike_count} #{reback} 回复

  • #{ahtml}#{created_at}

    #{content}

    展开

    #{like_count} #{dislike_count} 回复

  • 关闭
      广告