摘要:基因排序点图是基因表达分析的可视化利器。它按基因倍数变化从大到小排序,清晰呈现表达差异显著的基因。结合颜色编码 p 值,可直观判断基因表达变化的统计学意义,助力高效筛选关键基因。
导读:基因排序点图是基因表达分析的可视化利器。它按基因倍数变化从大到小排序,清晰呈现表达差异显著的基因。结合颜色编码 p 值,可直观判断基因表达变化的统计学意义,助力高效筛选关键基因。
《Nature Biomedical Engineering》文章“Potent prophylactic cancer vaccines harnessing surface antigens shared by tumour cells and induced pluripotent stem cells”Fig1B的基因排序图直观地展示了肿瘤相关蛋白在TM vs MM样品间的差异情况。
图中每个点代表一个肿瘤相关蛋白。点的X轴位置表示该蛋白按照log2FC从高到低的排序rank,即log2FC越大,其rank越小。点的Y轴对应log2FC值。点的大小与log2FC绝对值成正比,绝对值越大,点越大,说明该蛋白的表达变化程度越大。点的颜色表示p值,p值越小,颜色越深,表示该蛋白表达差异的统计学显著性越强。水平黑色实线表示log2FC=0,即无表达变化的基准线,水平虚线表示log2FC阈值,通常用于筛选具有生物学意义的差异表达蛋白。
该图后台R代码由DeepSeek编写,不得不感叹AI的能力。
1,打开作图URL
2,示例数据
点击图片上方的示例数据,下载,并使用excel打开。
示例数据包括3列:
第1列是基因名(或者蛋白名等)
第2列是log2FC,或者有正有负的值,例如GSEA结果的NES
第3列是p值,或者FDR等统计值
3,输入检查
示例数据:点击输入框下面的“示例”按钮,将载入示例数据。
真实数据:数据放在excel中,调整好后,Ctrl+A选中数据,Ctrl+C拷贝,Ctrl+V粘贴数据到输入框中。
然后使用输入框下面的“输入检查”按钮先对输入数据进行检查。若检查不通过,请根据检查提示重复【修改-输入检查】步骤,直到检查通过(如下图所示),然后可以继续选择参数。
注:1,首行第2、3列的名字作为R的参数,分别代表Y轴的说明和colorbar的说明,不能带空格,特殊符号
2,第一列基因名不能有重复
4,选择参数
图片大小:设置了图片的宽度,图片的高度。
待标注基因名:需要在图中标注的基因的名字,一行一个基因名,来自输入数据的第一列。若输入框留空,则请选择topN,默认标注top5的基因,即上调top5,下调top5。若将topN设置为0,同时输入基因的框留空,则不标注基因。
字体大小:设置了轴说明文字的字体大小(指X轴的Rank和Y轴的log2FC文字字体大小),轴刻度字体大小(指X轴和Y轴的刻度数字字体大小),标注基因名字体大小(指标注的基因名字的字体大小),图例标题字体大小(指图例中标题pValue和log2FC文字的字体大小),图例文字字体大小(指colorbar的p值刻度,点大小标尺文字的字体大小)。
Log2FC阈值:指两条水平虚线对应的Y轴log2FC的值。
标注文字距离点的距离:指标注的基因名距离对应点的距离,值越大,则上方的基因名越靠右,下方的基因名越靠左。
Y轴范围:两者都留空则根据log2FC的数值范围自动设置,若两者都有数值,则根据数值设置。
P值颜色:点对应p值的颜色,共设置了9种离散型调色板
Colorbar颜色是否转化:默认显示p值,选择转化选项后,颜色对应的值会进行转化,若p值范围跨数量级较多,选择转换可以更好地展示非常小的p值
字体:设置了期刊杂志中最常用的两种字体:Times New Roman和Arial。如需使用其他字体,可以下载pdf或者svg图片,然后使用acrobat illustrator或者inkscape进行编辑修改
5,提交出图
检查通过,并且参数选好后,点击“提交”按钮,约2s后,会在页面上显示基因排序图。我们提供了pdf、svg两种矢量图,png、tiff两种标量图供大家下载使用。可以使用acrobat illustrator或者inkscape软件编辑矢量图,进行组图,调整文字位置,添加说明等操作,以满足个性化需求。
微生信助力高分文章,用户290000+,谷歌学术6200+
来源:微生信