Sergej Khackimullin - Fotolia

评估 权衡你正在考虑的技术、产品和项目的利弊。

数据科学路径需要不断学习

随着开源编码语言的出现和在线课程的扩大,成为一名数据科学家的道路从未如此容易。

成为一名数据科学家需要决心和努力,但崛起网络公开课开源编码语言确保了这一点数据科学技能比以往任何时候都更容易获得。

大学和学院提供该领域所有职位所需的在线和面对面的课程。有抱负的数据科学家可以学习神经网络和深度学习、Hadoop平台和应用框架以及R和Python编程方面的课程。

但现在也有一些由非附属网站主办的开放在线课程,它们利用与传统课程相同的工具,促进自我教育。无论你是这个领域的新手还是想要专业化,都有多种途径可以考虑。

数据科学水平

Peter Krensky是Gartner的商业分析和数据科学团队的高级研究分析师,他将数据科学专业知识分为三个层次。

顶层由真实组成数据科学家。这些人都是经过高度培训的,能够理解并参与到他们领域生命周期的每个部分。

克兰斯基说:“他们可以获取、准备和设计自己的数据,以及建立自己的模型和应用机器学习。”“然后,他们还可以部署和管理这些模型,并理解我们所说的机器学习运作化,以及它是如何工作的。”

这只是数据科学操作领域的一小部分,有充分的理由,得到了很多关注。数据科学家能够处理一切。然而,出于时间和资源管理的原因,他们通常只执行列出的部分职责。多数情况下,他们得到了克兰斯基的第二个层次的支持:公民数据科学家。

Krensky说:“公民数据科学家是指任何拥有数量或技术背景,但不是主要专注于机器学习的人,他们正在提高机器学习的技能。”

这是一个比顶层人员大得多的群体,包括任何能够处理普通数据科学家的一些任务,但不是全部任务的人。

和下面公民数据科学家是那些对技术有一般理解并能将信息传递给消费者的人。他们支持上层人士,但他们的见解大多来自消费者层面。

让数据科学更容易获得

由于开放源码算法和开放在线课程的急剧增长,进入并爬上这个层次变得越来越有可能。进入大学和研究生院专门成为一名数据科学家的传统方法并不是唯一的选择,但仍在数据科学的最高层占据着主导地位。

“大量免费的高质量教育已经真正消除了进入的障碍。还有专家使用的免费桌面工具的数量,”Krensky说。“所有这些东西都可以在桌面上免费下载。”

Kaggle's State of Data Science and Machine Learning 2019调查数据科学家论坛发现,70%以上的数据科学家受访者拥有学士以上学位。

越来越多的大学提供夜间课程和课程,学习进入数据科学阶梯的任何层次所必需的基本技能。对于那些刚刚高中毕业的人,或者那些想要更熟悉自己领域其他部分的人来说,继续学习和之前的数据科学教育一样重要。

人力资源思想领袖和作家约翰·沙利文(John Sullivan)讨论了招聘过程,强调了适应性是多么重要。

“这是一种持续的学习,”沙利文说。“因为你今天知道的明天就会被淘汰。”

从你拿到学位的那一刻起,你的知识就开始过时了,沙利文说。公司应该寻找有能力处理工作的人,而不仅仅是学位。能够证明你有这些技能是一种竞争优势。

近年来,工具的可用性、某些编码语言的重要性以及对这些语言的需求都有所不同。有一个不断需要更多的教育公民数据科学家和传统数据科学家。Kaggle的调查清楚地表明了这一点,95%以上的数据科学家受访者表示,他们利用媒体来提高自己的技能。这包括博客、Kaggle本身和期刊,以及在线课程论坛。

雇主应该帮助那些已经在这一领域工作的人获得更多的教育。在技能提升方面,雇主和雇员之间的关系是互利的。通过投资本土人才,企业可以避免像经验丰富的数据科学家那样拿高薪。

Krensky说:“从这个角度来看,提高你已经拥有的量化专业人员的技能是一个更有吸引力的选择。”“人们愿意支付大学学费,如果在线课程有任何费用,他们也愿意支付,或者他们会做我所说的时间公平,他们会投入一定的时间去追求该领域的在线学位。”

这反过来又将员工提升到数据科学的更高层次,因此,增加他们的价值。

帮助你攀爬的工具

根据Krensky,Python是主导语言为程序员。2016年他加入Gartner时,该公司的调查称,25%的企业数据科学团队使用了这种编码语言。现在这个数字已经超过了90%。

要熟练掌握Python,可以通过大学课程,或者通过Coursera、edX、Udemy和DataCamp等平台上的新开放课程和在线课程的组合。

克兰斯基说:“通过与这些人合作,下载免费工具,参与像Kaggle这样的数据科学社区,他们基本上获得了免费的大规模在线公开课程教育。”

也许目前还没有一种方法可以完全取代这个领域的正规教育,但这些平台和各种选择的存在可以让更多的人得到帮助更多的机会

选择这条路或另一条路的人的技能水平和生产力不会本质上相同,但他们的工具包将会几乎相同。的算法,技术和机器学习框架基本上都是一样的,不管是在课堂上还是在网上。

“我喜欢列出人们的选择,”克兰斯基说。“没有最佳实践。这取决于个人,取决于他们的目标是什么,他们想要实现什么。”

深入挖掘商业智能最佳实践

搜索数据管理
搜索AWS
搜索内容管理
搜索甲骨文
搜索SAP
搜索SQL服务器
关闭