Tommi - Fotolia.

开始 通过我们的介绍内容让您自己加快速度。

数据科学家技能范围从数据准备到讲故事

数据科学家们不是天生的 - 他们是制作的。来自各种背景的IT专业人士正在努力获得公司正在寻找的数据科学技能。

没有一种类型的数据科学家。有些人开始作为开发人员,其他IT分析师,其中一些是杰克 - 全贸易数据创造者,其他人是商人转动数据瘾君子。

最近在波士顿的TDWI加速会议上展出了多样性,其中软件开发人员,业务分析师,IT专业人士,数据库管理员,Astrophysics专业甚至律师融合在一起数据科学家技能,以及他们将需要在该角色工作的策略 - 或者至少了解越来越多的人。

“如果我要与数据科学团队合作,我需要知道他们在谈论什么。我想了解这个概念,我希望能够从时刻致电BS,”大卫克里姆曼说,主要法律信息提供者的诉讼产品开发经理。

Kleiman在生产中的作用导致他走向数据科学作为越来越多的客户希望诉讼分析成为电子发现过程的一部分,以预测可能的情况结果。为了到达那里,法律信息公司的数据科学家收集用于预测诉讼结果,以预测高度准确性:法官,律师事务所,涉及的各方,法​​院位置和许多其他变量。科米曼解释说他们需要考虑如果数据很干净,什么是不存在,他们必须以正确的格式得到它以进行分析。

数据科学咕噜声

事实上,有人参与其中数据科学项目了解大部分工作涉及将数据搏斗到提交中。有这么多的数据,在这么多的形式中,来自这么多来源,也是如此多的丢失的

数据科学家,截至2017年1月的110,000美元和超过4,000名职位开口的中位数,由GlassDoor.com排名第一的1号工作。

“百分之九十的数据科学是ETL [提取,转换和装载] - 数据争吵方面,”数据科学培训组织数据科学培训组织的迈克尔李,创始人兼首席执行官,在TDWI加速期间。“专注于分析层不会提供您正在寻找的价值和洞察力。”

Citizen数据科学家认为它像喂养数据一样简单,因为将另一方送出的众多黑匣子中的一个并转变为彩色图表和图表需要再次认为,TDWI的数据专家表示。

“在将它们抛出算法之前,您需要确保这些值是有道理的,”硅谷数据科学家的高级数据科学家Chloe Mawer表示,他介绍了一次会议论探索性数据分析(EDA)在会议上。

数据科学家技能和人格特质
数据科学家技能和人格特质

Mawer表示,EDA是数据科学项目的第一部分,它被认为是最关键的一步,因为它确保数据分析将尽可能准确。EDA还允许您识别模式并开发假设,测试技术假设,并将帮助您选择要使用的预测模型。EDA还建立了数据的直觉,以便她解释说,数据科学家可以稍后识别错误的数据。

对于业务利益相关者,EDA确保结果在技术上都是声音,并确保被问到正确的问题。它测试业务假设,提供上下文并导致见解。EDA期间的心态应开放,质疑和接受违反期望的信息。

数据科学心态

推动企业期望的能力需要领导 - 一个关键数据科学家,用于定义最佳实践并将文化推向一个数据驱动的决策方法。建立目标和KPIS.李说,也是至关重要的。

数据科学家还必须能够退回并识别数据偏差;数据来自哪里,数据来源是谁,同样重要的是,什么不是包含在数据中。

“想想你丢失的客户,以及你可能已经做了什么来保持他们,”李说。

另一个关键数据科学家技能是表达的能力。他们需要从电脑屏幕后面出来,将他们的发现传达给整个企业的其他业务单位。

专家建议公司嵌入商业单位内的数据科学家因此,每个小组都受益于数据,并且对数据集有业务上下文。“在驾驶数据文化方面,”反馈是至关重要的,“李说。“你不想创造一个专家象牙塔。”

下一步

为什么物理学家制作良好的数据师

企业解释一下为什么他们需要数据科学家

测试你的数据科学技能知识

深入了解商业智能团队

搜索数据管理
搜索AWS.
搜索内容管理
搜索甲骨文
搜索树液
搜索SQL.服务器
关闭