《R语言与Bioconductor生物信息学应用》一书主要是使用R语言来解决生物信息学问题。主要作者是两位在生物信息学界有极深造诣的科研人士,高山和欧剑虹,这二位的博客地址如下:
http://blog.sciencenet.cn/u/gaoshannankai
http://pgfe.umassmed.edu/ou/
我本人也完成了其中部分章节的写作。此书的特点在于:
此书详细目录如下:
第一章 R基础知识4
1.1什么是R4
1.1.1 R语言的起源4
1.1.2 R语言的特点5
1.1.3 R语言的主要用途7
1.1.4 R语言的应用现状和发展趋势10
1.2R的下载与安装12
1.2.1 主程序的下载与安装12
1.2.2 扩展包的下载与安装14
1.2.3 R语言的集成开发环境16
1.2.4 R主程序和扩展包的管理与升级19
1.3 R语言快速入门21
1.3.1 从哪里入手开始学习R21
1.3.2 三板斧搞定R语言21
1.3.3 一个例子来说明三板斧22
1.4 一些简单的语法知识23
1.4.1 什么是编程23
1.4.2 变量23
1.4.3 函数24
1.4.4 综合案例25
1.5 本章源代码详解及小结25
1.5.1 例1-125
1.5.2 例1-226
1.5.3 例1-327
1.5.4 例1-428
1.5.5 小结30
参考文献:31
第二章 生物信息学基础知识4
2.1中心法则-生物信息流4
2.1.1 生物大分子4
2.1.2 中心法则7
2.1.3 基因组、转录组和蛋白质组8
2.1.4 非编码RNA和microRNA9
2.2测序与序列分析10
2.2.1 DNA测序技术10
2.2.2 第二代测序技术的应用领域12
2.2.3 序列分析13
2.2.4 序列比对和相似性搜索14
2.2.5 分子进化和系统发生树15
2.3基因表达分析17
2.3.1基因表达的检测方法17
2.3.2 基因表达数据分析18
2.3.3基因表达差异的显著性分析19
2.3.4基因本体论分析20
2.3.5通路分析22
2.4注释、统计与可视化22
2.4.1 注释与ID映射23
2.4.2 统计与可视化23
参考文献:24
第三章 R在生物信息学中的简单应用2
3.1 一个序列分析课题2
3.1.1 课题背景2
3.1.2 研究目的与实验设计2
3.1.3 数据获取与处理流程3
3.2 用R包(非bioconductor)实现课题4
3.2.1 定义全部函数(例3-1)4
3.2.2 课题实现13
3.2.3 源代码详解与小结16
3.3 用R包(bioconductor)实现课题一21
3.3.1 重新设计数据处理流程和全部函数(例3-2)21
3.3.2 课题实现25
3.3.3源代码详解与小结26
3.4 用R包(bioconductor)实现课题二26
3.41 重新设计数据处理流程和全部函数(例3-3)26
3.4.2 课题实现35
3.4.3源代码详解与小结35
第四章 Bioconductor简介1
4.1 什么是Bioconductor2
4.1.1 Bioconductor的起源2
4.1.2 Bioconductor主要特点2
4.2 Bioconductor包的分类介绍5
4.2.1 三大板块分类介绍5
4.2.2 软件包的进一步介绍6
4.2.3 按照应用领域分类9
4.3 从R到Bioconductor的跨越:Biostrings, BiomaRt以及AnnotationDbi包12
4.3.1 应用Biostrings处理生物序列13
4.3.2 应用BiomaRt获取实验数据与注释信息21
4.3.3 应用AnnotationDbi生成注释包27
参考文献:32
第五章Bioconductor分析基因芯片数据
5.1快速入门2
5.2基因芯片基础知识3
5.2.1 探针组3
5.2.2 主要的芯片文件格式4
5.3基因芯片数据预处理5
5.3.1 数据输入6
5.3.2 质量控制7
5.3.3 背景校正、标准化和汇总17
5.3.4 预处理的一体化算法20
5.4基因芯片数据分析24
5.4.1 选取差异表达基因24
5.4.2 注释27
5.4.3 统计分析及可视化28
5.5芯片处理实际课题一39
5.5.1 课题背景39
5.5.2 数据集与预处理40
5.5.3 R程序与代码讲解41
5.6芯片处理实际课题二42
5.6.1 课题背景42
5.6.2 数据集与处理过程43
5.6.3 R程序与代码讲解43
5.7芯片处理实际课题三44
5.7.1 课题背景44
5.7.2 数据集与处理过程45
5.7.3 R程序与代码讲解46
参考文献:48
第六章 Bioconductor分析RNA-seq数据4
6.1示例课题介绍4
6.1.1课题背景4
6.1.2数据集和处理过程4
6.2高通量测序基础知识5
6.2.1高通量测序原理5
6.2.2测序的质量分数9
6.2.3高通量测序文件格式12
6.3 RNA-seq技术的特点16
6.3.1 RNA-seq对芯片的优势16
6.3.2 RNA-seq存在的问题17
6.4 RNA-seq数据预处理18
6.4.1 质量控制18
6.4.2 读段清理22
6.4.3 转录组组装25
6.4.4 转录组定量和标准化25
6.4.5 线性相关系数27
6.5 RNA-seq数据分析28
6.5.1基因表达差异的显著性分析28
6.5.2 RNA-seq数据的其它分析31
参考文献:31
第七章 R的高级语法与如何创建R包
7.1 R的高级语法2
7.1.1 数据类型及相互转换2
7.1.2 向量运算6
7.1.3 函数8
7.1.4 循环与条件9
7.1.5 输入输出11
7.1.6 对象和类12
7.2 创建及发布自己的R/Bioconductor包14
7.2.1 在Windows下创建和发布R包14
7.2.2 在Linux下创建和发布包25
7.3 R包结构26
7.3.1 R的源代码包27
7.3.2 R的二进制包28
参考文献:29
附录A 进一步学习的资源
附录B R常用函数
附录C R的内存管理和帮助系统
购买方式:
支付宝账号: pibobo@126.com 何静
留言:姓名+R语言书+册数
定书后,请将邮寄地址(一定要邮编)和电话发以上电子邮件
电子邮件题目是买R语言书,内容就是姓名+邮寄地址+电话
本书定价58元,群内读者预定50元(包快递费);团购5本以上45元(包快递费);50本40元(包快递费);
如果大学指定为教材,我可以提供更多材料,长期合作,打造精品课程
http://blog.sciencenet.cn/u/gaoshannankai
http://pgfe.umassmed.edu/ou/
我本人也完成了其中部分章节的写作。此书的特点在于:
- 从实际课题出发,提出解决这个问题的思路,结合用到的原理或基础知识,但更偏重整个解决问题的框架和流程,选用R这种简单易学但功能强大的语言,把讲解延伸到具体程序代码,让读者100%经历整个课题研究过程。
- 最大的创新点是:实际课题直接来作者发表的SCI文章,全部都是真枪实弹,不杜撰所谓“实际应用”。国内外尚未见到与SCI文章紧密结合的生物信息书籍。
- 本书是多名R领域专家(全部都是一线科研工作者)通过互联网联手写作。在前期网上调研的基础上,尽量在本书内突出大多数人普遍关心而又难找相关资料的问题。
- 所见即所得,学到的知识可以通过简单编程(仅仅代码拷贝粘贴)加以实现,印象深刻,学了不会忘。提出三板斧学习法,让无基础的人也能编程。
- 本书作者通过QQ群直接面向读者答疑,并且共享了大量的参考资料和习题答案。使用正版书籍的读者都可以入群享受最好的服务。不在书中罗列基础知识凑字数,也不使用光盘,既能减轻读者负担,又能保护环境。
此书详细目录如下:
第一章 R基础知识4
1.1什么是R4
1.1.1 R语言的起源4
1.1.2 R语言的特点5
1.1.3 R语言的主要用途7
1.1.4 R语言的应用现状和发展趋势10
1.2R的下载与安装12
1.2.1 主程序的下载与安装12
1.2.2 扩展包的下载与安装14
1.2.3 R语言的集成开发环境16
1.2.4 R主程序和扩展包的管理与升级19
1.3 R语言快速入门21
1.3.1 从哪里入手开始学习R21
1.3.2 三板斧搞定R语言21
1.3.3 一个例子来说明三板斧22
1.4 一些简单的语法知识23
1.4.1 什么是编程23
1.4.2 变量23
1.4.3 函数24
1.4.4 综合案例25
1.5 本章源代码详解及小结25
1.5.1 例1-125
1.5.2 例1-226
1.5.3 例1-327
1.5.4 例1-428
1.5.5 小结30
参考文献:31
第二章 生物信息学基础知识4
2.1中心法则-生物信息流4
2.1.1 生物大分子4
2.1.2 中心法则7
2.1.3 基因组、转录组和蛋白质组8
2.1.4 非编码RNA和microRNA9
2.2测序与序列分析10
2.2.1 DNA测序技术10
2.2.2 第二代测序技术的应用领域12
2.2.3 序列分析13
2.2.4 序列比对和相似性搜索14
2.2.5 分子进化和系统发生树15
2.3基因表达分析17
2.3.1基因表达的检测方法17
2.3.2 基因表达数据分析18
2.3.3基因表达差异的显著性分析19
2.3.4基因本体论分析20
2.3.5通路分析22
2.4注释、统计与可视化22
2.4.1 注释与ID映射23
2.4.2 统计与可视化23
参考文献:24
第三章 R在生物信息学中的简单应用2
3.1 一个序列分析课题2
3.1.1 课题背景2
3.1.2 研究目的与实验设计2
3.1.3 数据获取与处理流程3
3.2 用R包(非bioconductor)实现课题4
3.2.1 定义全部函数(例3-1)4
3.2.2 课题实现13
3.2.3 源代码详解与小结16
3.3 用R包(bioconductor)实现课题一21
3.3.1 重新设计数据处理流程和全部函数(例3-2)21
3.3.2 课题实现25
3.3.3源代码详解与小结26
3.4 用R包(bioconductor)实现课题二26
3.41 重新设计数据处理流程和全部函数(例3-3)26
3.4.2 课题实现35
3.4.3源代码详解与小结35
第四章 Bioconductor简介1
4.1 什么是Bioconductor2
4.1.1 Bioconductor的起源2
4.1.2 Bioconductor主要特点2
4.2 Bioconductor包的分类介绍5
4.2.1 三大板块分类介绍5
4.2.2 软件包的进一步介绍6
4.2.3 按照应用领域分类9
4.3 从R到Bioconductor的跨越:Biostrings, BiomaRt以及AnnotationDbi包12
4.3.1 应用Biostrings处理生物序列13
4.3.2 应用BiomaRt获取实验数据与注释信息21
4.3.3 应用AnnotationDbi生成注释包27
参考文献:32
第五章Bioconductor分析基因芯片数据
5.1快速入门2
5.2基因芯片基础知识3
5.2.1 探针组3
5.2.2 主要的芯片文件格式4
5.3基因芯片数据预处理5
5.3.1 数据输入6
5.3.2 质量控制7
5.3.3 背景校正、标准化和汇总17
5.3.4 预处理的一体化算法20
5.4基因芯片数据分析24
5.4.1 选取差异表达基因24
5.4.2 注释27
5.4.3 统计分析及可视化28
5.5芯片处理实际课题一39
5.5.1 课题背景39
5.5.2 数据集与预处理40
5.5.3 R程序与代码讲解41
5.6芯片处理实际课题二42
5.6.1 课题背景42
5.6.2 数据集与处理过程43
5.6.3 R程序与代码讲解43
5.7芯片处理实际课题三44
5.7.1 课题背景44
5.7.2 数据集与处理过程45
5.7.3 R程序与代码讲解46
参考文献:48
第六章 Bioconductor分析RNA-seq数据4
6.1示例课题介绍4
6.1.1课题背景4
6.1.2数据集和处理过程4
6.2高通量测序基础知识5
6.2.1高通量测序原理5
6.2.2测序的质量分数9
6.2.3高通量测序文件格式12
6.3 RNA-seq技术的特点16
6.3.1 RNA-seq对芯片的优势16
6.3.2 RNA-seq存在的问题17
6.4 RNA-seq数据预处理18
6.4.1 质量控制18
6.4.2 读段清理22
6.4.3 转录组组装25
6.4.4 转录组定量和标准化25
6.4.5 线性相关系数27
6.5 RNA-seq数据分析28
6.5.1基因表达差异的显著性分析28
6.5.2 RNA-seq数据的其它分析31
参考文献:31
第七章 R的高级语法与如何创建R包
7.1 R的高级语法2
7.1.1 数据类型及相互转换2
7.1.2 向量运算6
7.1.3 函数8
7.1.4 循环与条件9
7.1.5 输入输出11
7.1.6 对象和类12
7.2 创建及发布自己的R/Bioconductor包14
7.2.1 在Windows下创建和发布R包14
7.2.2 在Linux下创建和发布包25
7.3 R包结构26
7.3.1 R的源代码包27
7.3.2 R的二进制包28
参考文献:29
附录A 进一步学习的资源
附录B R常用函数
附录C R的内存管理和帮助系统
购买方式:
支付宝账号: pibobo@126.com 何静
留言:姓名+R语言书+册数
定书后,请将邮寄地址(一定要邮编)和电话发以上电子邮件
电子邮件题目是买R语言书,内容就是姓名+邮寄地址+电话
本书定价58元,群内读者预定50元(包快递费);团购5本以上45元(包快递费);50本40元(包快递费);
如果大学指定为教材,我可以提供更多材料,长期合作,打造精品课程