单菌基因组组装、注释、遗传表征、分子分型、系统进化和传播溯源(2025.5)

B站影视 韩国电影 2025-05-16 13:37 3

摘要:福利公告:为了响应学员的学习需求,经过易生信培训团队的讨论筹备,现决定安排扩增子16S分析、宏基因组、单物种转录组、单菌基因组的线上/线下同时开课。报名参加线上直播课的老师可在1年内选择参加同课程的一次线下课 。期待和大家的线上线下会晤。

单菌基因组组装、注释、遗传表征、分子分型、系统进化和传播溯源

福利公告:为了响应学员的学习需求,经过易生信培训团队的讨论筹备,现决定安排扩增子16S分析、宏基因组、单物种转录组、单菌基因组的线上/线下同时开课。报名参加线上直播课的老师可在1年内选择参加同课程的一次线下课 。期待和大家的线上线下会晤。

目前可以通报的信息:

单菌基因组线上/线下开课时间:2025/5/23-25

转录组线上/线下开课时间:2025/8/22-24

扩增子线上/线下开课时间:2025/10/18-19

宏基因组线上/线下开课时间:2025/11/15-16

报名链接:https://www.bic.ac.cn/Training/fore/

开课背景

微生物 (细菌、病毒和真菌)的全基因组测序 (Whole genome sequencing, WGS)技术已取得了长足的进步,可通过足够低的成本、可观的通量和较短的时间完成。国内外相关的公共数据库也日益充盈,积累了大量的基因组数据和完备的样本信息。此外,随着宏基因组测序越来越普遍,很多研究也不满足于只获取图谱,而是希望对目标菌进行深入分析。有了基因组数据及公共数据,如何根据特定的研究目的,运用生物信息学对数据进行整合、分析和解读,成为亟待解决的问题。

课程涵盖内容和适用范围本课程利用全基因组测序(WGS)数据及生信方法,旨在研究:属于单个微生物物种 (Intra-specific)的特征菌株或病原体毒株基因组。

具体是:围绕细菌、病毒或真菌基因组的第二/三代测序数据 (单个或多个分离株,每株分别测序或重测序),完成基因组组装、基因注释、遗传表征、分子分型、系统进化和传播溯源

课程的测试数据来自细菌,但其分析框架也大体适用于病毒、真菌和原生生物。以上物种,具有一般的微生物学特征:个体小、增殖快、易传播;常为单倍体,基因组小;世代周期短,进化/演化迅速。以上特征,使其数据分析具有相似的理论依据和研究目标,例如有条件在单个课程内完成:从头组装 + 重测序分析;构建三类进化树(普通系统发育树、时间树和传播树)。

对于其它物种,如大型动/植物基因组 (尤其是跨物种),则不适用此课程,原因包括:实施难度 (动/植物基因组的组装难度更大),分析模块 (动/植物无需做传播与溯源分析)及中间数据 (本课程主要利用核心基因组构树,而非同源基因)等。

课程中,原理与实操并重,包括:基本概念、研究案例、采样原则、数据分析、图表输出和结果解读。

适用的人群:微生物学、进化生物学、传染病/流行病学、临床微生物检验、公共卫生领域 (疾控中心)的相关学生或研究人员。

本课程的技术与理论体系,也有助于微生物实验室/课题组:建立系统的基因组分析流程,完善质量管理体系,培养相关生信人才,提示软件、流程及数据库的开发方向和评估方法。

课程资源和模式

理论与实操。本课程提供了计算平台 (Linux教学服务器)、课件 (PPT/PDF)、流程代码、生信软件 (仅用于学习;若使用,请引用原作者)、配套数据库、课程直播、视频回看和答疑群。这些软/硬件条件,可帮助学员:快速部署流程,熟悉操作方法,强化编程技能,完善理论学习,提升专业技能。

直播与回放。在直播课程上,会带领学员一步步完成数据分析,并穿插讲解课件。在线视频回看不限次数,涵盖全部直播过程。理论配合实操,理解技术要领,利于回顾、审查和优化分析流程。

流程和代码。本课程提供搭建好的单菌基因组分析流程,主要基于Linux系统、R语言和部分Python脚本,以应对繁重、批量化的计算任务,同时保持整体分析的灵活性和可重复计算。代码,记录了分析的过程和细节,存档在计算机中,便于使用、回顾、审查、优化、发表和共享。一些在线数据分析与可视化工具,能够简化相对固定的分析模块,可配合使用。

分析流程和课程主线课程大纲和时间安排

每节课1小时一个主题,理论结合实战,学懂原理,实战操作,全是老司机多年经验和代码的无私分享。下面是课程安排,如11代表第一天第一节课,26代表第二天第六节课。(实际上课时顺序会略有调整)

01、02和03是课前的准备工作 (提前观看软件安装视频,或参加提前进行的软件安装直播)。

编号

主题

简介

01

系统与软件

Bioconda, Git, R, Rstudio, R包,PC软件安装等, Ubuntu子系统

02

编程基础

Linux系列教程, Linux常用命令, 生信程序基础课节选

03

Linux软件安装

Conda安装与配置, 相关软件安装

11

组装

基本概念, 测序质量评估 (NGS/TGS)

12

组装

全基因组从头 (De novo)组装

13

组装

Nanopore/PacBio组装的NGS纠错

14

注释

基因组草图过滤、排序及评估, 物种鉴定

15

注释

多位点序列分型 (MLST), 表型预测 (耐药/毒力)

16

注释

功能基因注释, 泛基因组分析、构树及绘图

21

核心基因组

序列变异, 基因型, SNP序列比对/对齐

22

核心基因组

计算遗传距离, 去除高频重组区

23

系统发育树

基于SNP构树, 最大似然法 (FastTree/RaxML/IQ-TREE)

24

系统发育树

进化树分簇, 可视化制图

25

时间树

贝叶斯法 (BEAST), 时间刻度树

26

溯祖

推断祖先日期, 贝叶斯天际线图

31

R统计与绘图

R包Ape进化分析, 邻接树, 最小进化树

32

R统计与绘图

遗传距离统计与绘图, 树的注释与关联

33

溯源

传播 (树)与溯源分析

34

文献案例

典型文献及其图形解读

课程关键词: 细菌、病毒、真菌全基因组测序;基因组组装与注释;分子遗传与进化;核心基因组;基因组流行病学/暴发流行;传播溯源。

宏基因组推荐

来源:微生物组

相关推荐