下载并安装 R 和 RStudio 。虽然 Rstudio 并非必须但它是一个很好的工具,如果你刚刚开始学习 R 非常建议你使用 Rstudio 进行学习,你需要特定的数据集来运行本文档中的代码。下载 data.zip 并将其解压到你选择的目录,文件夹名称应该是‘data’,你的 R 工作目录应该在 data 文件夹上一层级,也就是在你的 R 控制台中输入 dir("data") 时,应该能够看到数据文件夹的内容。
R 包可以理解为基础 R 的附加内容,可以帮你实现基础 R 中不直接支持的任务。正是通过这些扩展包才让 R 成为适合计算基因组学的工具。Bioconductor 项目是计算生物学相关软件包的专用库,同时 R 的主包存储库 CRAN 也有计算生物学相关的包。除此以外,R-Forge,GitHub 和 googlecode 也可能托管了部分 R 包。
你可以用 install.packages() 安装 CRAN 包(需要说明, # 是 R 中的注释字符)。
# 从 CRAN 安装名为 "randomForests" 的 R 包install.packages("randomForests")
你可以使用特定的安装方法来安装 bioconductor 包。
if (!requireNamespace("BiocManager",quietly=TRUE))install.packages("BiocManager")BiocManager::install("rtracklayer")
library(MASS)
ls("package:MASS") # functions in the package
ls() # objects in your R enviroment
# get help on hist() function
?hist
help("hist")
# search the word "hist" in help pages
help.search("hist")
??hist