R

Awesome R

Awesome

精选的R包和工具的精选列表. 灵感来自 awesome-machine-learning.

有关更好的导航,请参阅https://awesome-r.com

heart 对于前50个 CRAN下载的软件包或400+的回购软件 star

2019

  • vroom - 快速读取分隔文件 vroom

2018

2017

  • prophet - 用于生成具有线性或非线性增长的多季节性的时间序列数据的高质量预测的工具. prophet
  • tidyverse - 从tidyverse轻松安装和加载包 tidyverse
  • purrr - R的函数式编程工具包 purrr
  • hrbrthemes - 以意见,印刷为中心的ggplot2主题和主题组件 hrbrthemes
  • xaringan - 使用R Markdown和JavaScript库创建HTML5幻灯片 xaringan
  • blogdown - 使用R Markdown创建博客和网站 blogdown
  • glue - 将字符串粘贴到R中的数据.小,快,无依赖的解释字符串文字. glue
  • covr - R的测试覆盖率报告 covr
  • lintr - R的静态代码分析 lintr
  • reprex - 渲染用于共享的R代码位,例如,在GitHub或StackOverflow上. reprex
  • reticulate - R与Python的接口 reticulate
  • tensorflow - TensorFlow for R tensorflow
  • utf8 - 操作和打印UTF-8文本,修复R的UTF-8处理中的多个错误. utf8
  • Patchwork - 将单独的ggplots组合到同一图形中.

Integrated Development Environments

综合发展环境

  • RStudio heart - 适用于R的强大而高效的用户界面.适用于Windows,Mac和Linux.
  • Emacs + ESS - Emacs Speaks Statistics是emacs文本编辑器的附加软件包.
  • Sublime Text + R-Box - Sublime Text ⅔的附加软件包.
  • TextMate + r.tmblundle - TextMate ½的附加软件包.
  • StatET - 基于Eclipse的IDE for R.
  • Microsoft R - Revolution R将免费提供给学术用户,商业软件将专注于大数据,大规模多处理器功能.
  • R Commander - 提供基本图形用户界面的包.
  • Deducer - 菜单驱动的数据分析GUI,带有数据编辑器等电子表格.
  • Radiant - 基于Shiny的独立于平台的基于浏览器的界面,用于R中的业务分析.
  • Vim-R - R的Vim插件
  • Nvim-R - R的Neovim插件
  • JamoviJASP - Desktop software for both Bayesian 和 Frequentist methods, using a UI familiar to SPSS users.
  • Bio7 - IDE包含用于生态建模的模型创建,科学图像分析和统计分析的工具.
  • RTVS - 适用于Visual Studio的R工具.
  • radian (原名rtichoke) - 具有语法高亮功能的现代R控制台.
  • RKWard - R的可扩展IDE / GUI

Syntax

包改变了你使用R. 的方式

  • pipeR - 多范式管道实施.
  • lambda.r - R中的函数编程和简单模式匹配
  • purrr - 本着下划线.js精神的R的FP包.

Data Manipulation

烹饪数据包.

  • haven - 改进了在R中导入SPSS,Stata和SAS文件的方法.
  • tidyr - 通过传播和收集功能轻松整理数据.
  • rlist - 用于使用列表进行非表格数据操作的工具箱.
  • jsonlite - 一种在R中解析JSON文件的强大而快速的方法
  • ff - 用于存储大型数据集的数据结构.
  • lubridate - 一组用于处理日期和时间的函数.
  • bigmemory - 共享内存和内存映射矩阵. big *包提供了额外的工具,包括线性模型(biglm)和随机森林(bigrf).
  • fuzzyjoin - 在不精确的匹配上将表连接在一起.
  • tidyverse - 从tidyverse轻松安装和加载包.
  • snakecase - 自动解析并将字符串转换为蛇或骆驼等案例.
  • vroom - 快速读取分隔文件
  • DataExplorer - 使用最少的代码进行快速探索性数据分析.

Graphic Displays

用于显示数据的包.

  • ggfortify - 使用一行代码的ggplot2流行统计包的统一接口.
  • ggrepel - 将重叠的文本标签相互分开.
  • ggalt - ggplot2的额外坐标系,Geoms和统计变换.
  • ggstatsplot - 基于ggplot2的统计细节图
  • ggtree - 系统发育树的可视化和注释.
  • ggtech - ggplot2技术主题和规模
  • ggplot2 Extensions - 展示ggplot2扩展.
  • lattice - 强大而优雅的高级数据可视化系统.
  • corrplot - 相关矩阵或一般矩阵的图形显示. 它还包含一些执行矩阵重新排序的算法.
  • rgl - 用于R的3D可视化设备系统.
  • Cairo - 使用cairo图形库的R图形设备,用于创建高质量的显示输出.
  • extrafont - 在R图形中使用字体的工具.
  • showtext - 使R图形设备能够使用系统字体显示文本.
  • animation - 一种在R中使用生成动画图形的简单方法 ImageMagick.
  • gganimate - 使用ggplot2创建简单的动画.
  • misc3d - 处理3d图,等值面等的强大功能.
  • xkcd - 在图表中使用xkcd样式.
  • imager - 基于CImg库的图像处理包,用于处理图像并显示它们.
  • hrbrthemes - 以意见,印刷为中心的ggplot2主题和主题组件.
  • waffle - 在R中制作华夫饼(方饼)图表
  • dendextend - 可视化,调整和比较层次聚类的树.
  • r2d3 - D3可视化的R接口
  • Patchwork - 将单独的ggplots组合到同一图形中.
  • plot3D - 绘制多维数据
  • plot3Drgl - 绘制多维数据 - 使用'rgl'

HTML Widgets

交互式可视化包.

  • heatmaply - D3的交互式热图.
  • d3heatmap - 带D3的交互式热图(不再维护).
  • DataTables - 将R矩阵或数据帧显示为交互式HTML表.
  • dygraphs - 在R中绘制时间序列数据.
  • Leaflet - 最流行的JavaScript库交互式地图之一.
  • MetricsGraphics - 可以轻松创建D3散点图,折线图和直方图.
  • networkD3 - 来自R的D3 JavaScript网络图
  • scatterD3 - 带D3的交互式散点图.
  • rbokeh - R接口 Bokeh.
  • threejs - 交互式3D散点图和地球仪.
  • timevis - 创建完全交互式时间轴可视化.
  • visNetwork - 使用vis.js库进行网络可视化.
  • wordcloud2 - wordcloud2.js的R接口.
  • highcharter - 基于htmlwidgets的高级图表的R包装器

Reproducible Research

用于文化编程和可重复工作流程的软件包.

  • redoc - 可逆的可再生文件
  • tinytex - 轻巧且易于维护的LaTeX发行版
  • xtable - 将表导出为LaTeX或HTML.
  • rapport - 一个R模板系统.
  • rmarkdown heart - R的动态文档
  • Sweave - 用于使用R编写LaTeX报告的包.
  • texreg - 在LaTex和HTML中格式化统计模型.
  • checkpoint - 从检查点服务器上的快照安装包.
  • brew - 预先计算数据以增强报告模板. 可与knitr结合使用.
  • officer - 用于生成Microsoft Word,Microsoft PowerPoint和HTML报告的R包.
  • flextable - 在Microsoft Word,Microsoft PowerPoint和HTML报告中嵌入复杂表格(合并单元格,多级页眉和页脚,条件格式)的R包. 它与[官员]包合作,并与[rmarkdown]报告集成.
  • bookdown - 使用R Markdown编写图书.
  • ezknitr - 使用'knitr'时避免典型的工作目录痛苦
  • drake - 安 rOpenSci package for reproducible data science workflows too big for knitr.
  • R Suite - 为R设计灵活且可重现的部署工作流程的软件包

Web Technologies and Services

上网冲浪套餐.

  • Web Technologies List - 有关如何一起使用R和万维网的信息.
  • shinyjs - 在几秒钟内轻松改善您的Shiny应用程序中的用户交互和用户体验.
  • RCurl - R的常规网络(HTTP / FTP / ...)客户端界面
  • curl - 适用于R的现代灵活的Web客户端
  • httpuv - HTTP和WebSocket服务器库.
  • XML heart - 用于在R中解析和生成XML的工具.
  • xml2 heart - 优化的工具,用于在R中解析和生成XML.
  • OpenCPU heart - 用于R处理并发调用的HTTP API,基于Apache2 Web服务器,将R代码公开为REST Web服务并创建完整大小的多页Web应用程序.
  • Rfacebook - 通过R访问Facebook API.
  • RSiteCatalyst - 用于Adobe Analytics的R客户端库.
  • plumber - 将现有R代码公开为Web API的库.

Parallel Computing

并行计算包.

  • parallel - R从版本2.14.0开始,其中包括一个新的软件包并行包含(略微修改)的软件包副本 multicoresnow.
  • Rmpi - Rmpi​​为MPI API提供接口(包装器). 它还提供交互式R从站环境.
  • foreach heart - 并行执行循环.
  • future heart - 用于R中并行和分布式处理的最小,高效,跨平台的统一Future API; 专为初学者和高级开发人员设计.
  • DistributedR - HP Vertica Analytics Team提供的可扩展高性能平台.
  • ddR - 提供分布式数据结构并简化R中的分布式计算.
  • sparklyr - 来自RStudio的Apache Spark的R接口.
  • batchtools - 使用LSF,TORQUE,Slurm,OpenLava,SGE和Docker Swarm进行高性能计算.

High Performance

使R更快的包装.

  • Rcpp heart - Rcpp在R之上提供了强大的API,使R中的函数速度更快.
  • Rcpp11 - Rcpp11是对Rcpp的完全重新设计,目标是C ++ 11.
  • compiler - 使用JIT加速R代码

Language API

其他语言的套餐.

  • rJava - 低级R到Java接口.
  • jvmr - 集成R,Java和Scala.
  • rJython - 通过Jython与Python的R接口.
  • rPython - 允许R调用Python的包.
  • runr - 从R运行Julia和Bash
  • RJulia - R包叫朱莉娅.
  • JuliaCall - R和Julia之间的无缝整合.
  • RinRuby - 一个Ruby库,它集成了Ruby中的R解释器.
  • R.matlab - 读取和写入MAT文件以及R-to-MATLAB连接.
  • RcppOctave - Octave和Matlab的无缝接口.
  • RSPerl - 用于从Perl和Perl从R调用R的双向接口.
  • V8 - 嵌入式JavaScript引擎.
  • htmlwidgets - 将最好的JavaScript数据可视化带到R.
  • rpy2 - R的Python接口

Database Management

用于管理数据的包.

  • RODBC - R的ODBC数据库访问
  • DBI - 定义R和数据库管理系统之间的通用接口.
  • elastic - Elasticsearch HTTP API的包装器
  • mongolite - 用于R的流式Mongo客户端
  • odbc - 连接到ODBC数据库(使用DBI接口)
  • RMariaDB - MariaDB的R接口(旧的RMySQL包的替代品)
  • RMySQL - MySQL数据库的R接口.
  • ROracle - 基于OCI的Oracle数据库接口
  • RPostgres - postgres数据库的DBI兼容接口.
  • RPostgreSQL - PostgreSQL数据库系统的R接口.
  • RSQLite - R的SQLite接口
  • RJDBC - 通过JDBC接口提供对数据库的访问.
  • rmongodb - MongoDB的R驱动程序.
  • rredis - Redis客户端为R.
  • RCassandra - 直接接口(不是Java)到Apache Cassandra的最基本功能.
  • RHive - R扩展通过Apache Hive促进分布式计算.
  • RNeo4j - Neo4j图形数据库驱动程序.
  • rpostgis - 到PostGIS数据库的R接口并在R中获取空间对象

Machine Learning

使R更聪明的包裹.

  • anomalize - 使用Twitter的AnomalyDetection方法进行整齐的异常检测.
  • ahaz - 半参数加性危险回归的正则化.
  • arules - 挖掘关联规则和频繁项目集
  • bigrf - 大随机森林:分类和回归森林 大数据集
  • bigRR - 广义岭回归(p >> n具有特殊优势 cases)
  • bmrm - 规范风险最小化方案的捆绑方法
  • Boruta - 用于所有相关特征选择的包装算法
  • bst - 渐变提升
  • C50 - C5.0决策树和基于规则的模型
  • caret heart - 分类和回归训练
  • Clever Algorithms For Machine Learning
  • CORElearn - 分类,回归,特征评估和序数 evaluation
  • CoxBoost - Cox模型通过基于可能性的单次生存提升 终点或竞争风险
  • Cubist - 基于规则和实例的回归建模
  • e1071 - 统计部的杂项职能(e1071),TU Wien
  • earth - 多元自适应回归样条模型
  • elasticnet - 用于稀疏估计和稀疏PCA的弹性网络
  • ElemStatLearn - 书中的数据集,功能和例子:“元素 统计学习,数据挖掘,推理和 预测“由Trevor Hastie,Robert Tibshirani和Jerome Friedman
  • evtree - 全球最优树木的进化学习
  • forecast - 使用ARIMA,ETS,STLM,TBATS和神经网络模型进行时间序列预测
  • forecastHybrid - 来自“预测”包的ARIMA,ETS,STLM,TBATS和神经网络模型的自动集合和交叉验证
  • FSelector - 基于子集搜索或特征排名方法的特征选择框架.
  • frbs - 用于分类和回归任务的基于模糊规则的系统
  • GAMBoost - 基于可能性的广义线性和加性模型 boosting
  • gamboostLSS - GAMLSS的推进方法
  • gbm - 广义Boosted回归模型
  • glmnet heart - 套索和弹性网正则化广义线性模型
  • glmpath - 广义线性模型和Cox的L1正则化路径 比例风险模型
  • GMMBoost - 基于似然的推广广义混合模型
  • grplasso - 使用Group Lasso惩罚符合用户指定的模型
  • grpreg - 具有分组的回归模型的正则化路径 covariates
  • h2o heart - Deeplearning,Random forest,GBM,KMeans,PCA,GLM
  • hda - 异方差判别分析
  • ipred - 改进的预测因子
  • kernlab - kernlab:基于内核的机器学习实验室
  • klaR - 分类和可视化
  • kohonen - 有监督和无监督的自组织地图.
  • L0Learn - 用于最佳子集选择的快速算法
  • lars - 最小角度回归,套索和前进阶段
  • lasso2 - L1约束估计又名'套索'
  • LiblineaR - 基于Liblinear C / C ++库的线性预测模型
  • nlme heart - 混合效应模型,处理用户指定的残差协方差矩阵,与纵向试验中重复观测的分析相关
  • glmmTMB - 广义混合效应模型,处理用户指定的残差协方差矩阵,与纵向试验中重复观测的分析相关
  • LogicReg - 逻辑回归
  • maptree - 映射,修剪和绘制树模型
  • mboost - 基于模型的提升
  • mvpart - 多变量分区
  • ncvreg - SCAD和MCP惩罚回归的正则化路径 models
  • nnet - eed-forward神经网络和多项式对数线性模型
  • oblique.tree - 分类数据的倾斜树
  • pamr - Pam:微阵列的预测分析
  • party - 递归派系实验室
  • partykit - 递归派系工具包
  • penalized - L1(套索和融合套索)和L2(脊)惩罚估计 在GLM和Cox模型中
  • penalizedLDA - 使用Fisher线性判别式进行惩罚分类
  • penalizedSVM - 使用惩罚函数的特征选择SVM
  • quantregForest - quantregForest:分位数回归森林
  • randomForest - randomForest:Breiman和Cutler的随机森林用于分类和回归.
  • randomForestSRC - randomForestSRC:生存,回归和分类的随机森林(RF-SRC).
  • ranger - 随机森林的快速实施.
  • rattle - 用于R中数据挖掘的图形用户界面
  • rda - 缩小的质心正则判别分析
  • rdetools - 特征空间中的相关维度估计(RDE)
  • REEMtree - 纵向随机效应的回归树(面板) Data
  • relaxo - 轻松的套索
  • rgenoud - 使用衍生物进行GENetic优化的R版本
  • rgp - R遗传编程框架
  • Rmalschains - 使用Memetic算法和局部连续优化 在R中搜索链(MA-LS-Chains)
  • rminer - 更简单地使用数据挖掘方法(例如NN和SVM) 分类和回归
  • ROCR - 可视化评分分类器的性能
  • RoughSets - 使用粗糙集和模糊粗糙集理论进行数据分析
  • rpart - 递归分区和回归树
  • RPMM - 递归分区混合模型
  • RSNNS - 使用斯图加特神经网络的R中的神经网络 模拟器(SNNS)
  • Rsomoclu - 自组织地图的并行实施.
  • RWeka - R / Weka界面
  • RXshrink - RXshrink:通过广义脊或最小的最大似然收缩 角度回归
  • sda - 收缩判别分析和CAT分数变量选择
  • SDDA - 逐步对角判别分析
  • SuperLearnersubsemble - 多算法集成学习包.
  • svmpath - svmpath:SVM Path算法
  • tgp - 贝叶斯treed高斯过程模型
  • tree - 分类和回归树
  • varSelRF - 使用随机森林进行变量选择

Natural Language Processing

自然语言处理包.

  • text2vec - 矢量化和Word嵌入的快速文本挖掘框架.
  • tm - 一个全面的文本挖掘框架.
  • openNLP - Apache OpenNLP工具界面.
  • koRpus - 用于文本分析的R包.
  • zipfR - 词频分布的统计模型.
  • NLP - 自然语言处理的基本功能.
  • LDAvis - 主题模型的交互式可视化.
  • topicmodels - 由David M. Blei为主题建模(Latent Dirichlet Allocation(LDA)和Correlated Topics Models(CTM))开发的C代码的主题建模界面.
  • syuzhet - 使用三种不同的情绪词典从文本中提取情绪.
  • SnowballC - 基于C libstemmer UTF-8库的Snowball词干分析器.
  • quanteda - 用于文本数据定量分析的R函数.
  • Topic Models Resources - 主题模型学习和R相关资源.
  • MonkeyLearn - 使用Monkeylearn进行文本分析的R包.
  • tidytext - 将Hadley Wickham的整洁原则应用于文本挖掘.
  • utf8 - 操作和打印UTF-8文本,修复R的UTF-8处理中的多个错误.

Bayesian

贝叶斯推理的包.

  • coda - MCMC的输出分析和诊断.
  • mcmc - 马尔可夫链蒙特卡洛.
  • MCMCpack - 马尔可夫链蒙特卡洛(MCMC)套餐.
  • R2WinBUGS - 从R / S-PLUS运行WinBUGS和OpenBUGS.
  • BRugs - OpenBUGS MCMC软件的R接口.
  • rjags - JAGS MCMC库的R接口.
  • rstan heart - 与Stan MCMC软件的R接口.

Optimization

优化套餐.

  • lpSolve - 用于解决线性/整数程序的Lp_solve接口.
  • minqa - 通过二次近似的无导数优化算法.
  • nloptr - NLopt是一个用于非线性优化的免费/开源库.
  • ompr - 直接在R中以代数方式对混合整数线性程序进行建模
  • Rglpk - R / GNU线性编程套件接口
  • ROI - R优化基础设施('ROI')是一个用于处理R中优化问题的复杂框架.

Finance

处理钱的包裹.

  • quantmod heart - R的定量财务建模和交易框架
  • pedquant - 公共经济数据和定量分析
  • TTR - 用R构建技术交易规则的功能和数据
  • PerformanceAnalytics - 用于绩效和风险分析的计量经济学工具.
  • zoo heart - 常规和不规则时间序列的S3基础设施.
  • xts - 可扩展时间序列.
  • tseries - 时间序列分析和计算金融.
  • fAssets - 分析和建模金融资产.
  • scorecard - 信用风险记分卡

Bioinformatics and Biostatistics

用于处理生物数据集的包.

  • Bioconductor heart - 用于分析和理解高通量基因组数据的工具.
  • genetics - 处理遗传数据的类和方法.
  • gap - 用于人口和家庭数据遗传数据分析的综合方案.
  • ape - 系统发育和进化分析.
  • pheatmap - 漂亮的热图很容易.
  • lme4 - 广义混合效果模型.
  • nlme - 混合效应模型,处理用户指定的残差协方差矩阵,与纵向试验中重复观察的分析相关.
  • glmmTMB - 广义混合效应模型,处理用户指定的残差协方差矩阵,与纵向试验中重复观测的分析相关.

Network Analysis

用于构建,分析和可视化网络数据的软件包.

  • Network Analysis List - 网络分析相关资源.
  • igraph heart - 网络分析工具的集合.
  • network - 在R中操纵关系数据的基本工具
  • sna - 基本网络措施和可视化工具.
  • netdiffuseR - 网络扩散分析工具.
  • networkDynamic - 支持动态,(内部)时间网络.
  • ndtv - 用于构建各种格式的动态网络数据的动画可视化的工具.
  • statnet - 许多R网络分析包背后的项目.
  • ergm - R中的指数随机图模型
  • latentnet - 网络对象的潜在位置和群集模型.
  • tnet - 加权,双模和纵向网络的网络措施.
  • rgexf - 将网络对象从R导出到 GEXF,用于操纵网络软件等 Gephi 要么 Sigma.
  • visNetwork - 使用vis.js库进行网络可视化.

Spatial

探索地球的套餐.

  • CRAN Task View: Analysis of Spatial Data- 空间分析相关资源.
  • Leaflet - 最流行的JavaScript库交互式地图之一.
  • ggmap - 使用ggplot2在R中绘制地图.
  • REmap - 用于交互式地图数据可视化的JavaScript库ECharts的R接口.
  • sf - 改进的空间数据类和方法.
  • sp - 空间数据的类和方法.
  • rgeos - 几何引擎接口 - 开源
  • rgdal - 地理空间数据抽象库的绑定
  • maptools - 用于读取和处理空间对象的工具
  • gstat - 空间和时空地质统计建模,预测和模拟.
  • spacetime - 用于时空数据的R类和方法.
  • RColorBrewer - Provides color schemes for maps
  • spatstat - 空间点模式分析,模型拟合,模拟,测试
  • spdep - 空间依赖性:加权方案,统计和模型
  • tigris - 在R中下载并使用Census TIGER / Line shapefiles
  • GWmodel - 地理加权模型

R Development

包裹套餐.

  • Package Development List - R包以改进包开发.
  • promises - 基于Promise的异步编程的抽象
  • lineprof - 在R中可视化行分析结果
  • packrat - 使您的R项目更加孤立,便携和可重复.
  • installr - 从R内部安装软件的功能(适用于Windows).
  • import - R的导入机制
  • modules - R的替代(Python风格)模块系统
  • RStudio Addins - RStudio插件列表.
  • drat - 在GitHub或其他repos上创建和使用R存储库.
  • covr - 测试R包的覆盖范围,并(可选)将结果上传到 coveralls 要么 codecov.
  • lintr - R的静态代码分析以强制执行代码样式.
  • staticdocs - 为R包生成静态html文档.
  • sinew - 生成使用从函数脚本中删除的信息填充的roxygen2骨架.

Logging

记录包

  • futile.logger - R中的日志包类似于log4j
  • log4r - A log4j derivative for R
  • logging - 模拟python日志包的日志包.

Data Packages

便捷的数据包

  • engsoccerdata - 英国和欧洲足球比赛结果1871-2016.
  • gapminder - 摘自Gapminder数据集(过去50年来各国的数据).

Other Tools

  • R *的便捷工具

  • git2r - 使您可以从R编程访问Git存储库.

  • Conda - 大多数R软件包都可以通过Conda polyglot跨平台依赖关系管理器获得.

Other Interpreters

替代R引擎.

  • CXXR - 将R重构为C ++.
  • fastR - FastR是Truffle和Graal上Java语言的一种实现.
  • pqR - R的“快速”实现
  • renjin - 一个基于JVM的R解释器.
  • rho - 将R语言的解释器重构为R的完全兼容,高效的VM.
  • riposte - 快速解释器和RIT JIT
  • TERR - TIBCO Enterprise Runtime for R.

Learning R

*学习套餐R. *

  • swirl heart - 直接在R控制台中的交互式R教程.

Resources

在哪里发现新的R-esources.

Websites

Books

Podcasts

Reference Cards

MOOCs

大规模开放在线课程.

Lists

学习领域知识的丰富资源.

R Ecosystems

R社区和包裹集合(按字母顺序排列):

Other Awesome Lists

Contributing

欢迎您的贡献!

本作品采用知识共享署名 - 非商业性使用 - 相同方式共享4.0国际许可 - CC BY-NC-SA 4.0