暂无预览

交互效应分析(重复测量方差法)

交互效应分析是一种统计方法,用于评估两个或多个变量之间的相互作用对因变量的影响。其工作原理如下:

  1. 模型构建:使用线性回归模型,将因变量(如 Y)作为被解释变量,多个自变量(如 factor1factor2)及其交互项作为解释变量。模型形式为 Y ~ factor1 * factor2
  2. 拟合模型:通过最小二乘法拟合模型,估计各自变量及其交互项对因变量的影响。
  3. 方差分析:使用方差分析(ANOVA)方法,检验各自变量及其交互项对因变量的显著性。ANOVA 可以分解总变异,评估各自变量及其交互项是否显著影响因变量。

作用:

  • 交互效应分析通过线性回归和方差分析,评估多个变量及其交互作用对因变量的影响。
  • 该方法适用于研究变量之间的相互作用及其对因变量的综合影响。
  • 交互效应分析不仅关注各自变量的独立效应,还考虑它们之间的交互作用。

获取脚本Icon失败

矩阵相关性分析(R)

获取脚本描述失败

暂无预览

数据转置
实用工具
将数据的行列进行互换。

获取脚本Icon失败

时间依赖性ROC曲线(Python)

获取脚本描述失败

累计发生率曲线
生存问题 绘图
累积发生率曲线(Cumulative Incidence Function, CIF) 是一种在生存分析中常用的统计方法,用于估计在给定时间点上特定事件的发生率。CIF可以帮助我们理解数据集中的事件发生分布,并可视化事件发生率的变化。
生成CIF曲线时,需要时间(Time)结局(Status)以便进行生存分析。

其中, 时间需要是数值类型数据;
结局需要是整数,即:0(未发生)或1(发生);

CIF曲线的生成基于Python完成, 其中对于CIF曲线的实现使用到了sksurv软件包。
合并数据
实用工具
将两个矩阵按照指定方式进行合并。

暂无预览

组别效应分析(重复测量方差法)

组别效应分析是一种统计方法,用于评估组别变量对因变量的独立影响。其工作原理如下:

  1. 模型构建:使用线性回归模型,将因变量(如 Y)作为被解释变量,组别变量(如 group)作为解释变量。模型形式为 Y ~ group
  2. 拟合模型:通过最小二乘法拟合模型,估计组别变量对因变量的影响。
  3. 方差分析:使用方差分析(ANOVA)方法,检验组别变量对因变量的显著性。ANOVA 可以分解总变异,评估组别变量是否显著影响因变量。

作用:

  • 组别效应分析通过线性回归和方差分析,评估组别变量对因变量的独立影响。
  • 该方法适用于研究不同组别对某一变量的变化趋势和显著性。
  • 不涉及其他变量或交互效应,仅关注组别的独立效应。

暂无预览

时间依赖性ROC曲线(R)
生存问题 模型验证 绘图
时间依赖性ROC曲线(Time-dependent ROC)是一种用于评估预测模型性能的工具,特别适用于生存分析数据和需要考虑时间因素的情况。
时间依赖性ROC曲线的原理与常规的ROC曲线比较类似,前者相比后者多了时间因素,以便我们可以根据不同时间节点绘制不同的ROC曲线。
绘制时间依赖性ROC曲线,需要准备以下数据:
时间:即观测时间,要求为数值型变量;
结局:即最终事件是否发生,要求为数值型变量;其中,0为未发生,1为已发生;
风险评分:预测模型的风险评分,要求为数值型变量。

本方法的实现主要使用survivalROC包;本方法支持反转风险评分、绘制截断值、选择NNE或KM法估计;同时支持选择观测时间点。

暂无预览

生存模型决策曲线(DCA)
生存问题 绘图 模型验证
决策曲线分析(DCA)是一种评估预测模型在实际临床决策中应用价值的方法。它通过比较不同决策方案在特定阈值范围内的净收益来实现。这里的“净收益”是指考虑到假阳性和假阴性的结果所带来的益处和损失后的净效果。
DCA的核心原理是量化预测模型在特定临床决策阈值下的效用,并与其他决策策略(如对所有人进行治疗或对谁都不进行治疗)进行比较。

本实现使用到了R包 dcurves

暂无预览

生存问题LASSO回归(R)
预览版 生存问题
基于R语言的LASSO回归,主要处理生存问题。
最小绝对值选择与收缩算子(Least absolute shrinkage and selection operator, 又称LASSO回归)是一种通过构造一个惩罚函数,使回归模型中的变量系数进行压缩,从而达到精简模型,防止过拟合,解决共线性的数据挖掘方法。 Lasso回归可以使某些回归系数变为0,实现变量选择的效果。
提供R语言经典的两张LASSO图像,并且一并提供各变量最终系数。
训练(构建)本模型时,需要时间(Time),结局(Status),此外还需要提供计划建模的因素。
其中: 时间需要是数值类型数据;
结局需要是整数,即:0(未发生)或1(发生);
所有提供的因素类型不限,数字分组的等级变量需手动选择。

本任务中,对LASSO回归的实现主要使用到了glmnet包。