R 数据处理(一)(r语言数据处理过程)
off999 2024-11-07 11:34 32 浏览 0 评论
我们讲过了 Python 读取常见数据格式文件的方式。
下面,我们就讲讲如何用 R 来读取这些文件。
1、txt/csv 格式文件
read.table(file, header = FALSE, sep = "", quote = "\"'",
dec = ".", numerals = c("allow.loss", "warn.loss", "no.loss"),
row.names, col.names, as.is = !stringsAsFactors,
na.strings = "NA", colClasses = NA, nrows = -1,
skip = 0, check.names = TRUE, fill = !blank.lines.skip,
strip.white = FALSE, blank.lines.skip = TRUE,
comment.char = "#",
allowEscapes = FALSE, flush = FALSE,
stringsAsFactors = default.stringsAsFactors(),
fileEncoding = "", encoding = "unknown", text, skipNul = FALSE)
read.csv(file, header = TRUE, sep = ",", quote = "\"",
dec = ".", fill = TRUE, comment.char = "", ...)
read.csv2(file, header = TRUE, sep = ";", quote = "\"",
dec = ",", fill = TRUE, comment.char = "", ...)
read.delim(file, header = TRUE, sep = "\t", quote = "\"",
dec = ".", fill = TRUE, comment.char = "", ...)
read.delim2(file, header = TRUE, sep = "\t", quote = "\"",
dec = ",", fill = TRUE, comment.char = "", ...)
上面 5 个函数都可以用于读取表格格式文件。
read.csv 与 read.csv2 相较于 read.table,除了几个默认参数值不同外,其他参数都是完全一样的。
- read.table : sep 指定的默认分隔符为一个或多个空格,制表符、换行或回车,dec 指定的小数点以 . 分隔
- read.csv : 读取 , 分隔符文件
- read.csv2 : 读取 ; 分隔符文件,且小数点以 , 分隔
- read.delim : 读取 \t 分隔符文件
- read.delim2 : 读取 \t 分隔符文件,且小数点以 , 分隔
示例
> read.table('Downloads/data.txt')
V1 V2 V3 V4
1 segdup01284 hs3 111883743 111884767
2 segdup02286 hs1 152617218 152618252
3 segdup02286 hs3 111883745 111884756
4 segdup02365 hs1 158502674 158503718
5 segdup02365 hs3 111883744 111884768
6 segdup02574 hs1 199147461 199151487
7 segdup02574 hs3 113384907 113387537
8 segdup02968 hs1 235049483 235050522
9 segdup02968 hs3 111883744 111884768
写出文件
write.table(x, file = "", append = FALSE, quote = TRUE, sep = " ",
eol = "\n", na = "NA", dec = ".", row.names = TRUE,
col.names = TRUE, qmethod = c("escape", "double"),
fileEncoding = "")
write.csv(...)
write.csv2(...)
写出文件的函数与读取函数相对应
2. 读取 json 数据
这里我们使用 rjson 模块
2.1 安装
install.packages("rjson")
2.2 使用
数据
[
{
"Name": "Mario",
"Age": 32,
"Occupation": "Plumber",
"Rank": 3
},
{
"Name": "Peach",
"Age": 21,
"Occupation": "Princess",
"Rank": 1
}
]
读取
# 导入模块
library(rjson)
# 读取数据
data <- fromJSON(file = 'Downloads/data.json')
# 查看数据格式
# > str(data)
# List of 2
# nbsp;:List of 4
# ..nbsp;Name : chr "Mario"
# ..nbsp;Age : num 32
# ..nbsp;Occupation: chr "Plumber"
# ..nbsp;Rank : num 3
# nbsp;:List of 4
# ..nbsp;Name : chr "Peach"
# ..nbsp;Age : num 21
# ..nbsp;Occupation: chr "Princess"
# ..nbsp;Rank : num 1
可以看到,json 数据被转换为嵌套的 list
知道怎么读取 json 数据了,那如何写出成 json 格式的文件呢?
例如,我们想更改 Mario 的年龄为 45,并将 Peach 的等级改为 9
data[[1]]$Age <- 45
data[[2]]$Rank <- 9
# 转换为 json string
outJson <- toJSON(data)
# 保存为 new_data.json
write(outJson, file = "Downloads/new_data.json")
new_data.json
[
{
"Name": "Mario",
"Age": 45,
"Occupation": "Plumber",
"Rank": 3
},
{
"Name": "Peach",
"Age": 21,
"Occupation": "Princess",
"Rank": 9
}
]
3. xml 文件操作
我们以 KEGG 通路 hsa05130 的 kgml 文件为例
# 安装模块
install.packages("XML")
# 导入模块
library(XML)
# 解析 xml 文件
hsa <- xmlParse("Downloads/hsa05130.xml")
# 提取根节点
oot <- xmlRoot(hsa)
# 查看根节点名称
xmlName(root)
# [1] "pathway"
# 查看根节点的子节点数目
xmlSize(root)
# [1] 293
# 查看第一个子节点
root[[1]]
# <entry id="4" name="path:hsa04810" type="map" link="https://www.kegg.jp/dbget-bin/www_bget?hsa04810">
# <graphics name="Regulation of actin cytoskeleton" fgcolor="#000000" bgcolor="#FFFFFF" type="roundrectangle" x="1237" y="777" width="119" height="34"/>
# </entry>
root[[1]][[1]] # 查看第一个子节点的第一个子节点
# <graphics name="Regulation of actin cytoskeleton" fgcolor="#000000" bgcolor="#FFFFFF" type="roundrectangle" x="1237" y="777" width="119" height="34"/>
xmlSApply(root, xmlName) # 根节点的所有子节点名称
xmlSApply(root[[1]], xmlAttrs) # 子节点 1 的所有子节点属性
# graphics
# name "Regulation of actin cytoskeleton"
# fgcolor "#000000"
# bgcolor "#FFFFFF"
# type "roundrectangle"
# x "1237"
# y "777"
# width "119"
# height "34"
xmlSApply(root, xmlSize) # 所有子节点大小
# xpath 语法获取节点属性 id=4 的 entry
getNodeSet(root, "//entry[@id=4]")
# [[1]]
# <entry id="4" name="path:hsa04810" type="map" link="https://www.kegg.jp/dbget-bin/www_bget?hsa04810">
# <graphics name="Regulation of actin cytoskeleton" fgcolor="#000000" bgcolor="#FFFFFF" type="roundrectangle" x="1237" y="777" width="119" height="34"/>
# </entry>
#
# attr(,"class")
# [1] "XMLNodeSet"
# 转换为 list ,转换为 dataframe 可以用 xmlToDataFrame
hsa_list <- xmlToList(root)
# 更改数据
root[[1]][[1]] <- "haha"
# 保存
saveXML(root, file="hsa05130.xml",encoding="UTF-8")相关推荐
- 打米传奇手游可提现(打米传奇手游怎么提现)
-
个人感觉有些传奇游戏还是可以提现的,也就是现在所谓的搬砖服,不过想要提现也是需要付出的,普通的游戏玩家一天可以得到的收益并不是很高。想要获得高额收益是需要投资的。个人建议投资之前最好先观望一下,免的造...
- 虚拟号码发送短信平台(虚拟手机号收短信平台)
-
用虚拟手机号给别人发送短信的方法如下1、下载安装定时达人软件(安卓手机端),进入首页,点击下部的“添加新任务”,左边选择“通信”项。2、这时就可以看到右边的“虚拟电话”和“虚拟短信”选项。3、点击进入...
- 免费阅读软件(一念永恒小说免费阅读软件)
-
追书免费全本小说、追书神器免费版、易追书、全本追书阅读器等软件都是比较好用的免费读书软件。具体介绍如下: 1、追书免费全本小说,免费阅读热门网络小说; 2、追书神器免费版,有海量的书库,更...
- qq聊天软件免费下载安装(qq聊天应用下载)
-
首先右击你想下载的聊天记录的好友头像,这时把鼠标放到“聊天记录”上,你会看到三个选项,点击“查看聊天记录”,进入“信息管理器”界面。界面分为两部分,左边是你的好友名单,右边是详细的聊天记录,同...
- 下载官方浏览器(下载官方浏览器安装到桌面)
-
当我们在使用ie浏览器时或是操作电脑时,由于偶尔的不小心或是误点了某些安全提示,可能会导致ie浏览器无法使用下载功能,而导致ie浏览器无法下载文件和软件。首先我们来确认是安全软件阻止还是防火墙阻止还是...
- 万能种子搜索神器app(万能种子搜索神器2.9.9)
-
你好,万能播放器是一款功能强大的音视频播放软件,通常需要购买激活码或者注册码来激活使用。具体的激活方式可能因软件版本和开发者而异,以下是一般的激活步骤:1.购买激活码:前往官方网站或授权渠道购买激活...
- word免费版电脑版(word office免费版)
-
不同版本也不一样1.目前电脑中office365是订阅制,没有永久免费的政策。office2016与office2019可以永久激活使用。2、永久激活版本在电脑中只要自带office2016或者off...
- 可以免费下载音乐的app(可以免费下载音乐的软件并传到U盘)
-
目前市场上有不少免费的音乐下载软件,比如QQ音乐、网易云音乐等。这些免费的音乐下载软件一般会提供不同种类的音乐,从流行歌曲到经典老歌都可以找到,除此之外,这些软件还会针对用户进行推荐,根据用户的音乐口...
- office2007免安装绿色版(office2007绿色完整版)
-
把你的绿色版删除!附件的压缩包里有微软提供的卸载程序!运行一遍就可以了!office2007哪个版本好?针对office2007哪个版本好,office2007的版本主要有office2007官方下载...
- 魔兽官方对战平台(魔兽官方对战平台什么时候回归)
-
魔兽争霸的对战平台每个时间段都不一样。以前最后的就是浩方队员平台,还有QQ对战平台,后来又出来了vs对战平台。其中开始的浩方平台高手多,后来vs平台出来后大量高手都跑过去了,QQ平台一般菜鸟比较多。...
- 三国策略手游(三国策略手游试玩)
-
率土之滨官方版是一款超级好玩的全新策略三国竞技冒险手游,高清质风格的游戏画面能够带你体验全新的策略战斗,高度自由的竞技玩法,玩家可以在游戏中打造属于自己的三国世界1、《极无双》:3D动作军团征战手游《...
- 在线音频转换器(在线音频转换器Audio)
-
音频转换器是一种工具,它可以将一个音频格式转换成另外一个格式。使用它非常简单,首先打开音频转换器软件,然后选择需要转换的音频文件,设置输出格式和参数,最后点击转换按钮即可完成转换。注意,在设置输出格式...
- 拼音输入法哪个最好用(电脑打字常用输入法)
-
拼音输入法推荐使用谷歌拼音输入法。谷歌的拼音输入法,有五大特色:智能输入:选词和组句准确率高,能聪明地理解您的意图,短句长句,随想随打。时尚语汇:海量词库整合了互联网上的流行语汇和热门搜索词。...
- ps软件官方免费下载电脑版免费
-
1:点击下载好的安装包先进行解压,然后点击“Photoshop_CS6_CHS_lite.exe”文件2:在弹开的界面中点击“自定义安装”,这里小编说明一下,如果用户选择“快速安装”的话,那么软件的安...
- 传奇盒子平台大全(传奇盒子赚钱)
-
在996传奇盒子中,会员玩家可以在“我的游戏”中通过“云玩”进入之前体验过的传奇游戏,开启挂机模式后,就能在“云多开”系统里观察到自己的云设备和正在进行云游戏状态的传奇游戏,如果点进手机后台,还能看到...
欢迎 你 发表评论:
- 一周热门
-
-
抖音上好看的小姐姐,Python给你都下载了
-
全网最简单易懂!495页Python漫画教程,高清PDF版免费下载
-
飞牛NAS部署TVGate Docker项目,实现内网一键转发、代理、jx
-
Python 3.14 的 UUIDv6/v7/v8 上新,别再用 uuid4 () 啦!
-
python入门到脱坑 输入与输出—str()函数
-
Python三目运算基础与进阶_python三目运算符判断三个变量
-
(新版)Python 分布式爬虫与 JS 逆向进阶实战吾爱分享
-
失业程序员复习python笔记——条件与循环
-
系统u盘安装(win11系统u盘安装)
-
Python 批量卸载关联包 pip-autoremove
-
- 最近发表
- 标签列表
-
- python计时 (73)
- python安装路径 (56)
- python类型转换 (93)
- python进度条 (67)
- python吧 (67)
- python的for循环 (65)
- python格式化字符串 (61)
- python静态方法 (57)
- python列表切片 (59)
- python面向对象编程 (60)
- python 代码加密 (65)
- python串口编程 (77)
- python封装 (57)
- python写入txt (66)
- python读取文件夹下所有文件 (59)
- python操作mysql数据库 (66)
- python获取列表的长度 (64)
- python接口 (63)
- python调用函数 (57)
- python多态 (60)
- python匿名函数 (59)
- python打印九九乘法表 (65)
- python赋值 (62)
- python异常 (69)
- python元祖 (57)
