【迁移】使用 JTK_CYCLE 算法分析生物节律 JTK是一种非参数检测程序,能从芯片数据中检测循环转录本。除了计算每个转录本最佳的相位(LAG)、振幅(AMP)和周期(PER)外,JTK还计算了置换检验P值(ADJ.P)和Benjamini-Hochberg q值 (BH.Q)。与常规的周期检测算法相比,JTK具有更好的检验效能、更高的计算效率和更强的鲁棒性。R语言的metacycle包实现了ARSER、JTK_CYCLE、Lomb-Scarg 2022-09-19 #JTK_CYCLE #节律
【迁移】R解决导出PDF时的字体问题 安装包 conda activate clusterprofiler conda install -c conda-forge r-sysfonts -y conda install -c conda-forge r-showtext -y 绘图 1234567sysfonts::font_add("Arial Narrow", "~/font/Arial Nar 2022-09-13 #R #fonts
【迁移】使用MICE包对数据缺失值进行插补 在分析数据集时,常常会碰到一些缺失值,如果缺失值的数量相对总体来说非常小,那么直接删除缺失值就是一种可行的方法。但某些情况下,直接删除缺失值可能会损失一些有用信息,此时就需要寻找方法来补全缺失值。 安装包 12conda create -n mice conda-forge::r-tidyverse conda-forge::r-irkernel conda-forge::r-mice conda 2022-09-10 #MICE #R
【迁移】使用limma包进行差异基因分析 虽然现在已经是高通量测序的时代,大家基本都是从counts矩阵出发,使用DESeq2进行差异表达分析,但是GEO和ArrayExpress上的仍有海量且持续更新的芯片数据,有时候也不可避免遇到一些FPKM格式乃至已经进行了z-score转换的数据,对于这些数据的分析,我们可以认为其在适当变换下(log2FPKM),满足正态分布,那么仍可以使用limma直接进行分析。下面博主以E-MEXP-1422 2022-07-30 #DEG #limma
【迁移】oligo:GEO/ArrayExpress芯片数据处理 安装依赖 12345678910111213141516conda clean -y -allconda create -n geo -c conda-forge r-base=4.1.3conda activate geoconda install -c conda-forge r-tidyverse=1.3.1 -yconda install -c conda-forge r-irkernel 2022-07-29 #oligo #GEO #ArrayExpress
【迁移】菜鸟博主对神经网络的简单理解 博主最近在看临床预测模型,里面涉及到一些神经网络的相关知识,这里记录一下博主的简单理解。 基本概念 X:一个nx维的输入张量,可以是nx=0的标量,nx=1的向量,nx=2的矩阵,或更高维的张量 Y:一个ny维的输出张量,可以是nx=0的标量,nx=1的向量,nx=2的矩阵,或更高维的张量 f:一个特定结构的神经网络,如简单的BP神经网络、复杂的深度神经网络DNN等,用于将X映射到Y W:一个n 2022-07-28 #llama
【迁移】Counts矩阵的标准化方法:TMM和VST、RLOG TMM:The Trimmed Mean of M value by edgeR VST:The variance stabilizing transformation by DESeq2 RLOG:The regularized-logarithm transformation by DESeq2 Counts矩阵来源于STAR匹配得到的结果:df <- read.csv('GSE12 2022-07-27 #TMM #VST #RLOG
【迁移】从差异基因到RRA聚合 通过比对,我们得到了counts矩阵,接下来可以进行DEGs分析。此时如果我们有多组之间的对比,则可以使用RRA算法来聚合我们的结果。 RRA的安装 1234567891011121314151617181920conda create -n tcga -c conda-forge r-base=4.1.2 -yconda activate tcgaconda install -c conda-f 2022-07-22 #DEGs #RRA
【迁移】森林图展示回归分析的结果 配置环境 基础编程环境 GitHub 下载加速 可能需要用到的加速服务 1234conda create -n forestplot -c conda-forge r-forestplot -yconda activate forestplotconda install -c conda-forge r-tidyverse r-irkernel -yRscript -e "IRker 2022-07-15 #forestplot #regression
【迁移】有序分类Logistic回归 Logistic 回归的假设 假设1:因变量唯一,且为有序多分类变量 假设2:存在一个或多个自变量,可为连续、有序多分类或无序分类变量。 假设3:自变量之间无多重共线性。 假设4:模型满足“比例优势”假设。 选择自变量 12345paste0('"',paste(colnames(data$training_set), collapse = '" 2022-07-15 #regression