中易网

vs Python:R是现在最好的数据科学语言吗

答案:1  悬赏:70  
解决时间 2021-01-26 06:39
vs Python:R是现在最好的数据科学语言吗
最佳答案
2012年的时候我们说R是学术界的主流,但是现在Python正在慢慢取代R在学术界的地位。不知道是不是因为大数据时代的到来。

Python与R相比速度要快。Python可以直接处理上G的数据;R不行,R分析数据时需要先通过数据库把大数据转化为小数据(通过groupby)才能交给R做分析,因此R不可能直接分析行为详单,只能分析统计结果。所以有人说:Python=R+SQL/Hive,并不是没有道理的。

Python的一个最明显的优势在于其胶水语言的特性,很多书里也都会提到这一点,一些底层用C写的算法封装在Python包里后性能非常高效
(Python的数据挖掘包Orange canve
中的决策树分析50万用户10秒出结果,用R几个小时也出不来,8G内存全部占满)。但是,凡事都不绝对,如果R矢量化编程做得好的话(有点小难度),会
使R的速度和程序的长度都有显著性提升。

R的优势在于有包罗万象的统计函数可以调用,特别是在时间序列分析方面,无论是经典还是前沿的方法都有相应的包直接使用。
相比之下,Python之前在这方面贫乏不少。但是,现在Python有了
pandas。pandas提供了一组标准的时间序列处理工具和数据算法。因此,你可以高效处理非常大的时间序列,轻松地进行切片/切块、聚合、对定期
/不定期的时间序列进行重采样等。可能你已经猜到了,这些工具中大部分都对金融和经济数据尤为有用,但你当然也可以用它们来分析服务器日志数据。于是,近
年来,由于Python有不断改良的库(主要是pandas),使其成为数据处理任务的一大替代方案。

做过几个实验:
1. 用python实现了一个统计方法,其中用到了ctypes,multiprocess。
之后一个项目要做方法比较,又用回R,发现一些bioconductor上的包已经默认用parallel了。(但那个包还是很慢,一下子把所有线程都用掉了,导致整个电脑使用不能,看网页非常卡~)
2. 用python pandas做了一些数据整理工作,类似数据库,两三个表来回查、匹配。感觉还是很方便的。虽然这些工作R也能做,但估计会慢点,毕竟几十万行的条目了。
3. 用python matplotlib画图。pyplot作图的方式和R差异很大,R是一条命令画点东
西,pylot是准备好了以后一起出来。pyplot的颜色选择有点尴尬,默认颜色比较少,之后可用html的颜色,但是名字太长了~。pyplot
的legend比R 好用多了,算是半自动化了。pyplot画出来后可以自由拉升缩放,然后再保存为图片,这点比R好用。

总的来说Python是一套比较平衡的语言,各方面都可以,无论是对其他语言的调用,和数据源的连接、读取,对系统的操作,还是正则表达和文字处
理,Python都有着明显优势。
而R是在统计方面比较突出。但是数据分析其实不仅仅是统计,前期的数据收集,数据处理,数据抽样,数据聚类,以及比较复杂的数据挖掘算法,数据建模等等
这些任务,只要是100M以上的数据,R都很难胜任,但是Python却基本胜任。

结合其在通用编程方面的强大实力,我们完全可以只使用Python这一种语言去构建以数据为中心的应用程序。
但世上本没有最好的软件或程序,也鲜有人能把单一语言挖掘运用到极致。尤其是很多人早先学了R,现在完全不用又舍不得,所以对于想要学以致用的人来说,如果能把R和Python相结合,就更好不过了。
我要举报
如以上问答内容为低俗、色情、不良、暴力、侵权、涉及违法等信息,可以点下面链接进行举报!
大家都在看
几十跟几十相加得数先写个位还是十位
创文明城市请问城管你文明吗
第一句歌词是:啊咦呀咦呀,啊咦呀咦呀,啊咦
小明骑车去爷爷家,3分骑了450米,剩下的路比全
有人买过云度汽车吗?云度π3究竟怎么样啊?
杭州玩五天,怎么才省钱又好玩
凤绫儿高端古装摄影地址在什么地方,想过去办
神采婚纱摄影(041县道与201省道交叉口北150米
早教机到底需不需要啊?
18加x等于括号48加x括住乘九分之四等于几
我活不下去了,求生活对我好一点行不行
彩源印刷广告地址好找么,我有些事要过去
怎么设置QQ群简介不让别人看见
新买的华硕电脑要不要注册,如果注册,注册后
我妈妈突然之间就变了一个人,快来人救救命阿.
推荐资讯
南传佛教,北传佛教,藏传佛教有何分别
有人有这对情头的原图吗?
helio x30 处理器怎么样
PVC塑料的物性表
中国联通我的卡是联通的怎么连接呢
汉语拼音的n和l怎样发音正确
如何对商场管理人员进行培训
凤凰传奇里好像有一首歌里的歌词是:是谁在唱
传奇3的小BOSS座标,的刷新时间
i watch ( ) tv after ( ) dinner.
可能就看看叫你看看见见你看空间进你空间那你
如何从土壤样品中鉴定所含微生物
手机登qq时,显示手机磁盘不足,清理后重新登
刺客的套装怎么选啊?