R语言教程 -- 数据结构(数据框,因子,列表)
四、数据框(数据表)
R语言中做统计分析的样本数据,都是按数据框类型操作的。
数据框的每一列代表一个变量属性的所有取值,每一行代表一条样本数据。
1. 创建数据框
通过函数data.frame()把多个向量组合起来创建,并设置列名称。其基本格式为:
data.frame(col1,col2,col3,...)
其中,列向量col1, col2, col3, …可以为任意类型。
注:矩阵也可以通过函数data.frame()转化为数据库。
2. 数据框索引
列标或列名称索引:
data_iris[,1...
R语言教程 -- 基本数据类型与日期时间变量
一、基本数据类型
1. R语言的基本数据类型
包括:数值型、逻辑型、字符型、缺省值、浮点型、复数型、整数型等。
表1 基本数据类型的判别与转换
类型
判别函数
转换函数
numeric
is.numeric()
as.numeric()
logical
is.logical()
as.logical()
character
is.character()
as.character()
NA
is.na()
as.na()
...
R语言教程 - R语言的安装与使用
R是统计分析软件,在数据分析、数据挖掘领域有优势;与SAS比最大的好处就是免费,其次是有各种现成的程序包可用,再次是具有极好的制图功能(数据可视化)。
一、下载安装
到R语言官网或镜像站:
https://www.r-project.org/
https://mirrors.tuna.tsinghua.edu.cn/CRAN/
下载最新版R-4.3.1安装即可,安装时可选择32位或64位版本。
建议再接着安装相应版本的R语言集成开发环境Rstudio,地址:
https://www.rstudio.co...
R语言教程 -- ggplots绘制显著性柱状图
1. 数据预览
2. 代码实现(绘制显著性柱状图)
3. 结果
R语言教程 -- dplyr包中的distinct()函数
dplyr::distinct对数据框去重,该方法默认保留重复记录的第一条记录
dplyr包中distinct()函数与base包中的unique()函数比较类似,不同的是unique()是一个泛型函数,可以针对向量、矩阵、数组、数据框甚至列表这五种数据类型,求取唯一值。而distinct()函数则是专门为数据框设计的,这也与tidyverse系列包的宗旨一致。
之前用distinct()函数的时候,总容易出现问题,归根结底是没有弄明白distinct()各参数的含义,囫囵吞枣的看了看文档,就开始写了。今天...
R语言教程 -- dplyr 数据操作 数据过滤 (filter)
在R的使用过程中我们几乎都绕不开Hadley Wickham 开发的几个包,前面说过的ggplot2、reshape2以及即将要讲的dplyr
因为这几个包可以非常轻易的使我们从复杂的数据操作中逃离,操作过程简洁,最重要的是数据结果也异常简洁。
首先我们来了解下第一个函数filter()
filter(.data, ...)
参数很简单,只有data,即要操作的数据对象,其他都是数据操作条件。
看一些简单的例子:
可以进行多条件筛选,条件可以用逗号隔开
多条件筛选,...
R语言教程 -- fread读取文件
在数据科学和统计分析中,数据的读取是非常重要的一个步骤。R语言以其强大的数据处理能力,提供了多种方式读取不同格式的数据文件。本篇文章将重点介绍如何使用R语言中的 fread 函数读取数据文件,并通过代码示例帮助你更好地理解这个过程。
什么是fread?
fread 是R语言中 data.table 包提供的一个函数,是 read.table 的一个快速替代品。 fread 函数可以高效地读取文本文件,包括CSV、TSV等格式的数据文件。它处理大型数据集的能力,使得数据导入过程更加快速和高效。
特点
速度...