**原文:**R is for Research, Python is for Production **作者:**Matt Dancho and Jarrell Chalmers, 2021-2-18 **译者:**张敬信 **转载于:**知乎R&Python数据科学专栏 作者简介: Matt Dancho 是商业科学公司(http://www.business-science.io)的创始人,该公司是一家协助组织将数据科学应用于商业应用程序的咨询公司。他是 R 包 tidyquant 和 timetk 的作者,自 2011 年以来一直从事数据科学领域的业务和财务分析。Matt 拥有业务和工程学硕士学位,在商业智能、数据挖掘、时间序列分析、统计、机器学习领域具有丰富经验。 R 和 Python 都很棒。本文将通过展示各自生态中主要进展来谈一下两种语言各自的一些优势。 1. R 用于研究 如果让我不得不用一个词来形容 R,那就是:tidyverse。它帮助您完成研究任务——处理数据、可视化结果,从构思迭代到代码————毫无压力,更准确地说,是乐在其中。下面用终极 R 速查表来解释为什么说 R 用于研究。 要开始学 R,tidyverse 是开启旅程的理想之地。这是规范化的包和工具的合集,具有一致的结构化编程接口,而 R base 则明显更复杂且用户友好性较低。 我们可以找到许多解决特定问题的更小的 R 包,但以下是最重要的 R 包: Dplyr&ggplot2 两个强大的帮助您完成日常决策的包是 dplyr 和 ggplot2,它们非常适合用于数据处理和可视化。这是数据科学家或数据分析师可以拥有的两个最重要的技能。 Rmarkdown 毫无疑问,R的最特殊优势之一是 Rmarkdown,它是一个框架用于创建可重现报告,演示文稿、博客、期刊以及更多!想象一下,有一个可以运行的报告,并创建了一个易于共享的 HTML 页面或 PDF 以与您的团队共享。这绝对是比每个星期一早上在 Excel 中点击数百次更惬意的方法。 Shiny Shiny 是 R 中的另一个框架,用于创建交互式 Web 应用程序。Shiny 的最佳功能之一,就是通过易于使用的 GUI(图形用户界面)为团队中非聚焦数据的成员提供决策所需的数据科学工具。想象一下,您的团队聚在一起进行周一下午的计划会议,已经查看了在 Rmarkdown 中创建的上一周的报告,并使用协作式 Shiny Web 应用程序运行模拟以确定下一步将数据引导到何处。

Continue reading

前言 如果你还在纠结:学数据科学到底用 python 还是 R 好? 现在我的回答是:大可不必。现在两者的变量可以相互调用了。你可以用 R 做数据处理(tidyverse),可视化(ggplot2),用 python 做开发。具体可参考该文章:R Vs Python: What’s the Difference? 这一切有它就行了——reticulate 包 reticulate 包涵盖了用于 Python 和 R 之间协同操作的全套工具,在 R 和 Rstudio 中均可使用,主要包括: 1)在 R 中支持多种方式调用 Python。包括 R Markdown、加载 Python 脚本、导入 Python 模块以及在 R 会话中交互式地使用 Python。 2)实现 R 和 Python 对象之间的转换(例如 R 和 Python 数据框、R 矩阵与 NumPy 数组之间)。 在 R 会话中嵌入了 Python 会话,从而实现了无缝的、高性能的互操作性。如果你是使用 Python 进行某些工作的 R 开发人员或使用两种语言的数据科学团队的成员,那么 reticulate 包可以极大地简化你的工作流程!官方资料可见:reticulate 网站 本文框架 前期准备 安装 reticulate 包 可以直接安装,并进行加载,非常方便。

Continue reading

简介 R文档沟通前两期内容: R沟通|舍弃Latex,拥抱Rbeamer吧! R沟通|制作个性化ppt! 这期主要介绍下如何在Rstudio中运行和使用.tex文件,并给大家安利一个非常nice的模板和根据该模板制作的案例。 使用教程 在ElegantPaper网站中下载整个仓库,可以直接下载到本地github或者下载压缩包。 解压压缩包,找到主要的.tex文件(比如这里的中文文件cn),通过Rstudio打开。 点击Compile PDF即可得到模板对应的paper了。 注意:我这里环境已经配置好了,使用Tinytex。具体如何下载可以参考TinyTeX 中文文档[2] 具体样例 小编研究生一年级期末作业(数据包络分析,复杂网络,回归分析等)就是用这个模板制作的,现在正好出文档沟通系列,就给大家献丑下🤡。 当然该模板也有很多别人使用,制作后的文章和文件都在github中: Risk Awareness(风险意识)文档说明 Bank Custody (银行存管)说明 小编有话说 小编作业原件就不分享给大家了(太low),大家可以参考网上大佬们的排版实例,根据他们的代码来学习latex语法,这是提升技能最有效方式之一了。 小编已经为大家搬运了这三份文件(欢迎大家去他们的github标星,收藏,制作不易,都是无偿分享的,需要读者们的鼓励和支持)。如需直接获得这些文件,在后台输入latex模板即可获取以上文件(免费,没有啥硬性条件,有条件的帮我分享群,朋友圈,那就太感谢了! 🤠),实在办不到帮忙点点文末广告也行!

Continue reading

Author's picture

Liangliang Zhuang

Statistics, Data, and Programming

PhD candidate

Zhejiang, Hangzhou