--- title: "一、R语言介绍" subtitle: 《区域水环境污染数据分析实践》
Data analysis practice of regional water environment pollution author: 苏命、王为东
中国科学院大学资源与环境学院
中国科学院生态环境研究中心 date: today lang: zh format: revealjs: theme: dark slide-number: true chalkboard: buttons: true preview-links: auto lang: zh toc: true toc-depth: 1 toc-title: 大纲 logo: ./_extensions/inst/img/ucaslogo.png css: ./_extensions/inst/css/revealjs.css pointer: key: "p" color: "#32cd32" pointerSize: 18 revealjs-plugins: - pointer filters: - d2 --- ```{r} #| include: false #| cache: false lang <- "cn" require(tidyverse) require(learnr) knitr::opts_chunk$set(echo = TRUE) ``` ## R的历史 ::: columns ::: {.column width="85%"} - 1976年: - 前身是S语言,由贝尔实验室John Chambers及其同事开发 - 1993年: - R语言由Ross Ihaka和Robert Gentleman在奥克兰大学开发 - R的诞生是为了提供一个强大的统计计算和图形显示的平台 ::: ::: {.column width="15%"} ![](https://cran.r-project.org/Rlogo.svg) ::: ::: - 1995年:R发布第一个公开版本 - 2000年代: R语言逐渐成为统计学和数据科学领域重要工具 - 2010年:Hadley Wickham发布了ggplot2包,数据可视化方面更强 - 2016年:创建CRAN(Comprehensive R Archive Network),R包中央库 - 至今 - **R语言已成为数据科学和统计学领域最受欢迎的工具之一,被广泛用于数据分析、机器学习、数据可视化等领域** ## R的特点 ### 一般特点 - 免费、开源、支持各个主要计算机系统。 - 完整的程序设计语言,基于函数和对象。 - 支持完善的数据类型,如向量、矩阵、数据框等。 ### 技术特点 - 所有存在都是对象。 - 所有动作都是函数调用。 - 支持函数编程和对象类。 - 是动态类型语言,运行速度相对较慢。 ## R的参考资料 ### 推荐参考书 - Hadley Wickham and Garrett Grolemund(2022). [R for Data Science](https://r4ds.hadley.nz/) - Hadley Wickham(2019). [Advanced R](https://adv-r.hadley.nz/) - Hadley Wickham(2016). [ggplot2 Elegant Graphics for Data Analysis](https://ggplot2-book.org/) - John M. Chambers(2008). [Software for Data Analysis-Programming with R](https://www.springer.com/gp/book/9780387759357) - Venables, W. N. & Ripley, B. D.(2002). [Modern Applied Statistics with S (MASS)](https://www.springer.com/gp/book/9780387954578) ## R的参考资料 ### 中文参考书 - 《R语言编程艺术》 - 《R语言实战》 - 《R语言教程与实践》 - 《R语言数据可视化实战》 - 《R语言从入门到精通》 ## R的下载与安装 ### R的下载与安装 - R的官方网站:[https://www.r-project.org/](https://www.r-project.org/) - CRAN镜像网站:[http://mirror.bjtu.edu.cn/cran/](http://mirror.bjtu.edu.cn/cran/) - 下载官方的R软件后按提示安装 {{< video https://vimeo.com/203516510 width="600" height="400">}} ## RStudio ### 什么是RStudio? - RStudio官方网站: [https://posit.co/products/open-source/rstudio/](https://posit.co/products/open-source/rstudio/) - RStudio是一个集成开发环境(IDE),专门用于R语言编程和数据分析。 - 它提供了一个直观的界面,使得编写、调试和运行R代码变得更加容易。 ## RStudio ### RStudio的功能 1. **代码编辑器**:提供了语法高亮、自动补全和代码折叠等功能。 2. **控制台**:用于直接执行R代码并查看结果。 3. **环境和历史记录**:可以查看当前加载的数据、函数和变量,以及之前执行过的命令。 4. **图形和可视化**:RStudio内置了绘图设备,可以方便地创建各种统计图表。 5. **文件管理器**:可直接在RStudio中管理文件和项目。 6. **包管理器**:方便地安装、更新和管理R包。 7. **Markdown编辑器**:支持Markdown格式,可以创建美观的文档和报告。 ## 如何获取RStudio? - RStudio可以从官方网站免费下载并安装:[RStudio官网](https://posit.co/download/rstudio-desktop/) - RStudio是一个强大的R编程环境,为R用户提供了丰富的功能和工具。 - 它简化了R语言的使用,提高了数据分析和可视化的效率。 {{< video https://vimeo.com/203516968 width="600" height="400">}} ## 扩展包:R package - R有一万多个扩展软件包,提供了各种各样的功能 - 已安装的基本R软件伴随一些必要的扩展包,如base, stats, graphics等,这些包在启动R时会默认载入 - 其它扩展包需要用`library(.)`函数载入运行 - 或者采用`dplyr::filter(.)`方式 ::: panel-tabset ### Code ```{r} #| echo: true #| eval: false #| out-width: 50% # load a R package library(ggplot2) # plot it based on the functions from `ggplot2` package mtcars |> dplyr::filter(cyl != 8) |> ggplot(aes(hp, mpg, color = am)) + geom_point() + geom_smooth(formula = y ~ x, method = "loess") ``` ### Output ```{r} #| echo: false #| out-width: 80% #| fig-width: 6 #| fig-height: 3 library(ggplot2) mtcars |> dplyr::filter(cyl != 8) |> ggplot(aes(hp, mpg, color = am)) + geom_point() + geom_smooth(formula = y ~ x, method = "loess") ``` ::: ## 安装R包 - 以安装sos包为例。 - 在RStudio中调用“Tools”菜单的“Install Packages”,输入或选择sos即可安装。 - R图形界面安装 - 如果不用RStudio, 在R图形界面选菜单“程序包-安装程序包”进行安装。 - 在CRAN镜像选择窗口中选择中国的镜像,如“China (Beijing 2)”,然后选择要安装的扩展软件包名称即可完成下载和安装。 - 程序安装 ```r # 指定镜像网站并安装扩展包 options(repos=c(CRAN="https://mirror.tuna.tsinghua.edu.cn/CRAN/")) install.packages("sos") # 当R包不是CRAN标准包,代码放在[github](https://github.com) if (!require(devtools)) install.packages('devtools') devtools::install_github("kjhealy/socviz") ``` ## 安装R包 {{< video https://vimeo.com/203516241 width="600" height="400">}} ## 结语 - R语言是一种强大的统计计算和数据分析工具,适用于各种领域。 - 通过学习R语言,可以进行数据处理、统计分析和数据可视化。 ## 欢迎讨论!{.center} `r rmdify::slideend(wechat = FALSE, type = "public", tel = FALSE, thislink = "https://drwater.rcees.ac.cn/course/public/RWEP/@PUB/SD/")`