定义

R编程语言

R编程语言是一个开源脚本语言预测分析和数据可视化。

R的初始版本于1995年发布,以允许学术统计学家和其他具有复杂的编程技能来执行复杂数据的人统计分析并在多个视觉图形中显示结果。“r”名称是从其两名开发人员名称的第一个字母,罗斯伊哈卡和罗伯特绅士当时与奥克兰大学相关联。

R编程语言包括功能它支持线性建模、非线性建模、经典统计、分类、聚类等。由于其强大的功能和源代码形式免费下载的事实,它在学术环境中仍然很受欢迎自由软件基金会sGNU一般公共许可证。它编译并运行unix.平台和其他系统,包括Linux,视窗和麦克斯。

R语言的吸引力已经逐渐从学术界扩展到商业领域数据分析师那些在大学里接受过R培训的人更喜欢继续使用它,而不是选择一个他们没有经验的新工具。

R软件环境

R语言编程环境是围绕一个标准构建的命令行界面。用户利用这一点阅读数据并将其加载到工作区中,指定命令并接收结果。命令可以是任何东西,从简单的数学运算符,包括+、-、*和/,到执行线性回归和其他高级计算的更复杂的函数。

用户还可以编写自己的功能。环境允许用户将单独的操作组合,例如将单独的数据文件加入单个文档,从而拔出单个变量并运行a回归在生成的数据集合中,进入一个可以在又一遍过使用的单个函数。

循环函数在R编程环境中也很流行。这些函数允许用户重复执行某些操作,例如从更大的数据集中提取样本,用户希望指定的次数不限。

R语言利弊

R编程语言的许多用户喜欢免费下载,提供复杂的数据分析功能,并有一个活跃的在线用户社区,他们可以在那里寻求支持。

因为它已经存在多年,并且在整个存在过程中都很受欢迎,语言相当成熟。用户可以下载增强语言的基本功能的附加软件包。这些包启用用户可视化数据,连接外部数据库,地理地图数据和执行高级统计功能。还有一个流行的用户界面被称为RStudio,简化了R语言中的编码。


r编程部分1简介。

R语言被批评为在应用于大型数据集时提供缓慢的分析。这是因为该语言使用单线程处理,这意味着基本的开源版本只能使用一个中央处理器在一个时间。相比之下,现代大数据分析在并行数据处理上蓬勃发展,同时利用数十个CPU,跨越一组服务器来快速处理大数据量。

除了它的单线程处理限制外,R编程环境是一个内存中的应用程序。所有的数据对象都存储在机器的内存在给定的会议期间。这可以限制数据r一次性的数据量。

r和大数据

这些限制减轻了R语言在大数据应用。许多企业用户利用R作为探索性和调查工具,而不是将R应用到生产中。数据科学家将使用R对样本数据进行复杂的分析,然后在确定数据中有意义的相关性或聚类后,通过企业规模的工具将发现的结果应用到产品中。

一些软件供应商已经在他们的产品中添加了对R编程语言的支持,这使得R在现代大数据领域中获得了更强的基础。包括IBM、Microsoft、Oracle、SAS Institute、TIBCO和Tableau在内的一些供应商,在他们的分析软件和R语言之间进行了某种程度的集成。还有一些流行的开源大数据平台的R包,包括Hadoop火花

这是最近更新的2017年3月

继续阅读关于R编程语言

深入挖掘预测分析

搜索数据管理
搜索AWS
搜索内容管理
搜索甲骨文
搜索树液
搜索SQL.服务器
关闭