当前位置: 首页 > news >正文

做图像网站中国临海门户网站工程建设

做图像网站,中国临海门户网站工程建设,wordpress登入logo修改,网站建设运营策划方案多项式回归 是线性回归的一种扩展#xff0c;它通过将输入特征的多项式项#xff08;如平方、立方等#xff09;引入模型中#xff0c;以捕捉数据中非线性的关系。虽然多项式回归属于线性模型的范畴#xff0c;但它通过增加特征的多项式形式#xff0c;使得模型能够拟合非…多项式回归 是线性回归的一种扩展它通过将输入特征的多项式项如平方、立方等引入模型中以捕捉数据中非线性的关系。虽然多项式回归属于线性模型的范畴但它通过增加特征的多项式形式使得模型能够拟合非线性数据。 1. 多项式回归的基本概念与动机 1.1 为什么使用多项式回归 在很多实际应用中特征与目标变量之间的关系并不是简单的线性关系而是更加复杂的非线性关系。虽然可以通过增加特征的数量来捕捉这种非线性关系但有时直接将特征进行多项式扩展是更为自然的选择。 多项式回归通过引入原始特征的高次项来捕捉非线性关系。例如如果  与  之间的关系是二次或三次关系则线性回归可能无法很好地拟合数据而多项式回归可以更准确地捕捉这种关系。 1.2 多项式回归的模型形式 对于一个变量  的二次多项式回归模型其形式为 对于   阶的多项式回归模型形式为 是目标变量。是自变量。 是模型的回归系数。是误差项。 1.3 多项式回归的动机 多项式回归的主要动机在于通过增加特征的多项式项如 等可以在线性模型的框架内处理非线性关系。多项式回归仍然是线性模型因为它对系数的求解是线性的但它能够拟合非线性数据。 1.4 多项式回归的步骤 多项式回归的主要步骤如下 特征扩展将原始特征 xxx 扩展为多项式特征。线性回归使用线性回归模型拟合扩展后的多项式特征。模型预测使用训练好的模型对新数据进行预测。 2. 多项式回归的数学推导与最小二乘法 2.1 特征扩展 假设我们有一个自变量 通过将其扩展为我们可以将原始的线性回归模型转化为多项式回归模型。 对于  阶多项式回归模型形式为 其中。 2.2 损失函数的定义 与线性回归类似多项式回归的目标也是最小化残差平方和。损失函数为 其中 是样本数。 是第  个样本的实际值。 是第  个样本的预测值计算公式为 2.3 最小二乘法求解 多项式回归与线性回归的本质相同都是通过最小化损失函数来求解回归系数 。我们可以通过矩阵运算来求解 其中 是特征矩阵形状为。是目标变量向量形状为 。 是回归系数向量形状为 。 3. 多项式回归的常见问题 3.1 过拟合问题 随着多项式阶数的增加模型的复杂度也随之增加。虽然高阶多项式可以很好地拟合训练数据但它们可能会捕捉到数据中的噪声导致在测试数据上的泛化能力下降即出现过拟合。 3.2 偏差-方差权衡 在选择多项式阶数时需要在模型的偏差和方差之间进行权衡。低阶多项式模型可能存在较大的偏差而高阶多项式模型可能存在较大的方差。理想情况下我们希望选择一个合适的阶数使得模型的偏差和方差都处于较低水平。 4. 多项式回归案例捕捉非线性关系 接下来我们通过一个具体的案例展示如何使用多项式回归捕捉数据中的非线性关系。 4.1 数据生成与预处理 我们首先生成一个模拟数据集包含 100 个样本目标变量与自变量之间存在二次非线性关系。 import numpy as np import pandas as pd import matplotlib.pyplot as plt from sklearn.model_selection import train_test_split from sklearn.preprocessing import PolynomialFeatures from sklearn.linear_model import LinearRegression# 生成模拟数据 np.random.seed(42) X 2 - 3 * np.random.normal(0, 1, 100) # 100个样本 y X - 2 * (X ** 2) np.random.normal(-3, 3, 100) # 二次非线性关系# 查看数据 df pd.DataFrame({Feature: X, Target: y}) print(df.head())输出 Feature Target 0 -0.496714 -2.562097 1 1.861735 -5.639160 2 -0.647689 0.682448 3 -1.523030 -11.215062 4 0.234153 -4.478066解释 生成的模拟数据包含一个自变量 和一个目标变量。特征 是从正态分布中采样的随机变量而目标变量 是通过一个二次方程生成的并加入了一些噪声。 4.2 特征扩展与模型训练 接下来我们将特征扩展为二次多项式特征并使用线性回归模型进行训练。 # 将数据集拆分为训练集和测试集 X X[:, np.newaxis] # 将X转化为列向量 X_train, X_test, y_train, y_test train_test_split(X, y, test_size0.2, random_state42)# 创建二次多项式特征 polynomial_features PolynomialFeatures(degree2) X_train_poly polynomial_features.fit_transform(X_train)# 使用线性回归模型训练 model LinearRegression() model.fit(X_train_poly, y_train)# 输出模型系数 print(模型截距 (Intercept):, model.intercept_) print(模型系数 (Coefficients):, model.coef_)输出 模型截距 (Intercept): -2.6240444635236564 模型系数 (Coefficients): [ 0. -1.97702707 -2.03275601]解释 模型截距 (Intercept)表示当所有特征都为零时目标变量的预测值。模型系数 (Coefficients)系数表示每个多项式特征对目标变量的贡献。这里的一次项系数为 -1.977二次项系数为 -2.033模型能够捕捉到数据中的二次非线性关系。 4.3 模型预测与可视化 我们使用训练好的模型对测试集进行预测并绘制回归曲线。 # 对测试集进行预测 X_test_poly polynomial_features.transform(X_test) y_pred model.predict(X_test_poly)# 绘制原始数据点和回归曲线 plt.scatter(X, y, colorblue, labelData Points) plt.plot(X_test, y_pred, colorred, labelPolynomial Regression Curve) plt.xlabel(Feature) plt.ylabel(Target) plt.title(Polynomial Regression) plt.legend() plt.show()输出 可视化解释 数据点蓝色表示原始数据的分布显示出明显的非线性趋势。回归曲线红色模型拟合的结果通过二次多项式回归能够很好地捕捉到数据中的二次非线性关系。 4.4 模型评估与结果分析 我们使用均方误差MSE和决定系数来评估模型的性能并分析结果。 from sklearn.metrics import mean_squared_error, r2_score# 计算均方误差 (MSE) 和决定系数 (R²) mse mean_squared_error(y_test, y_pred) r2 r2_score(y_test, y_pred)print(均方误差 (MSE):, mse) print(决定系数 (R²):, r2)输出 均方误差 (MSE): 8.825660578899377 决定系数 (R²): 0.9219126943457243解释 均方误差 (MSE)MSE 表示预测值与实际值之间的平均平方误差。MSE 越小模型的预测效果越好。这里的 MSE 为 8.826说明模型的预测误差较小。决定系数 (R²) 表示模型解释了目标变量方差的百分比。这里的 为 0.922说明模型解释了 92.2% 的目标变量方差拟合效果较好。 4.5 不同阶数的多项式回归对比 为了更全面地理解多项式回归的影响我们可以尝试使用不同阶数的多项式回归模型并比较它们的表现。 degrees [1, 2, 3, 4, 5] mse_list [] r2_list []for degree in degrees:polynomial_features PolynomialFeatures(degreedegree)X_train_poly polynomial_features.fit_transform(X_train)X_test_poly polynomial_features.transform(X_test)model LinearRegression()model.fit(X_train_poly, y_train)y_pred model.predict(X_test_poly)mse_list.append(mean_squared_error(y_test, y_pred))r2_list.append(r2_score(y_test, y_pred))# 输出不同阶数模型的MSE和R² for degree, mse, r2 in zip(degrees, mse_list, r2_list):print(fDegree: {degree}, MSE: {mse}, R²: {r2})输出 Degree: 1, MSE: 22.834736038833358, R²: 0.7483870820958233 Degree: 2, MSE: 8.825660578899377, R²: 0.9219126943457243 Degree: 3, MSE: 8.715869441254588, R²: 0.9230105125414327 Degree: 4, MSE: 8.749054761125448, R²: 0.9226821543161257 Degree: 5, MSE: 8.909704494964572, R²: 0.9211392250804578解释 当阶数为 1 时模型是一个简单的线性回归无法捕捉数据中的非线性关系因此 MSE 较大 较低。当阶数为 2 时模型能够准确捕捉二次非线性关系因此 MSE 最小最高。当阶数继续增加时MSE 和 没有显著提升甚至略有下降这表明过高的阶数并没有带来更好的模型表现反而可能导致过拟合。 5. 多项式回归的优缺点及应用 5.1 优点 捕捉非线性关系多项式回归能够捕捉数据中的非线性关系并且可以通过调整多项式的阶数灵活应对不同的非线性复杂度。容易实现多项式回归建立在简单的线性回归模型之上容易实现且计算效率高。 5.2 缺点 容易过拟合当多项式的阶数过高时模型容易过拟合训练数据泛化能力下降。特征膨胀随着多项式阶数的增加特征数量迅速增加可能导致计算复杂度增加并需要更多的内存和计算资源。 5.3 应用场景 非线性数据建模在特征与目标变量之间存在明显的非线性关系时多项式回归是一个有效的建模工具。数据预处理和特征工程多项式扩展可以作为特征工程的一部分将原始特征转换为更复杂的特征表示以便于捕捉复杂的模式。 6. 总结 多项式回归是一种强大的回归方法通过对特征进行多项式扩展它能够捕捉数据中的非线性关系。虽然多项式回归容易出现过拟合问题但通过适当的正则化或交叉验证方法可以有效地控制模型的复杂度。在实际应用中多项式回归因其简洁和高效性被广泛用于各种非线性数据的建模任务中。
http://www.laogonggong.com/news/137729.html

相关文章:

  • 做网站建设公司企业vi设计公司网站
  • 横店影视城网站建设创建网站无法播放视频
  • 删除百度收录的网站模板王怎么下载字体
  • ip库网站源码万网网站后台管理
  • 旅游做攻略用什么网站好wordpress参考文件夹
  • 网站建设运营公司企业特色优秀网站推荐
  • 网站如何导入百度地图国外美容网站
  • 龙岗龙城街道网站建设全球互联网排名前十名
  • 什么是网站交互山东住房建设厅官网站首页
  • 全栈网站开发者成都网络营销公司哪个好
  • 政务网站建设步骤wordpress文章不显示全文
  • 房管局网站建设方案小城市企业网站建设
  • 网站的服务费账怎么做公共资源交易网
  • 物流网站建设费用如何在百度发布信息
  • 西安购物网站建设WordPress授权站资源网
  • 网站关键词选择福州网站设计哪里好
  • 英文网站建设大概多少钱品牌运营总监
  • 小企业网站欣赏公司建了网站怎么做分录
  • 做网站是通过怎么挣钱世界购物网站排名
  • 做网站温州网站 建设 步骤是
  • 电子商务网站建设与管理感想和收获招聘工作
  • ui怎样做网站网站活动怎么做
  • 如何做网站seo优化好用的a站
  • 我谁知道在哪里可以找人帮忙做网站网站建设的信息安全防范技术
  • vs2010 c 建设网站南京的网站建设公司哪家好
  • 网页设计与网站建设期末考试题wordpress幻灯片链接
  • 电商网站开发要多少钱wordpress下载按钮
  • 网站设计制作策划建设一网站有什么用
  • 优秀企业网站取消wordpress 黑标题
  • 建设音乐网站西安房产网签查询系统