Sergey Nvns - Fotolia

新闻 了解最新的企业技术新闻和产品更新。

政府IT专家:雇佣数据科学家并不是一门精确的科学

美国政府专家警告称,数据科学中没有独角兽这种东西。您的数据科学团队需要的不仅仅是程序员和技术专家。

华盛顿——政府机构在将庞大的数据存储转化为有用的信息时,面临着与企业相同的问题。就政府而言,这些信息被用于提供医疗保健、科学研究、法律保护甚至打仗等服务。

在本周的Veritas公共部门愿景日上,公共部门IT专业人士谈到了他们在使数据有用和保持数据安全方面面临的挑战。他们目前的主要工作包括寻找合适的人来填补数据分析的角色,包括雇佣数据科学家。他们所描述的数据科学技能作为一个需要技术和主题专业知识的角色组合,这通常需要一个多样化的团队来获得成功。

美国国家科学基金会(National Science Foundation)的数据科学家蒂芙尼·朱利安(Tiffany Julian)表示,她最近参加了一个焦点小组,参与了人事管理办公室(Office of Personnel Management)发起的定义工作数据科学家

“其中一个重要的信息是,不存在独角兽这种东西。你不雇佣一名数据科学家。你创建了一个共同从事数据科学的团队,”朱利安说。

朱利安说数据科学包括多程序员和技术专家。了解自己公司或机构使命的学科专家也起到了一定作用。

“你需要你的软件工程师,你需要你的程序员,你需要你的数据库工程师。”“但是你也想要你的常识社会科学家参与。你不能只对其中一个领域进行优先排序。假设你非常擅长Python,也非常擅长r,你仍然需要提出数据和过程,测试它,得出结论。你雇佣的人不会拥有你真正需要的所有技能数据驱动的决策。"

招聘:知道自己不懂一切的人

朱利安说,因为她是一名数据科学家,她所在机构的其他人问,在招聘数据科学家时应该寻求哪些技能。

你不能雇佣数据科学家。你创建了一个团队,让人们一起研究数据科学。
蒂芙尼朱利安数据科学家,国家科学基金会

“我知道自己并非无所不知,我在寻找这种智慧,”她说。“你不是数据科学家,你是程序员,你是分析师,你是这些角色中的一个。”

美国专利商标局(USPTO)首席数据策略师兼投资组合经理汤姆•比奇(Tom Beach)表示,他在寻找数据科学家时也采取了类似的方法。

“这些人知道的足够多,知道他们不是什么都知道,但他们非常有创造力,”他说。

比奇补充说,在雇佣数据科学家时,他寻找的是“有解决真正具有挑战性问题的愿望的人”。抽象问题和一段代码之间有很大的脱节。在我们的组织中,一个处理专利和商标的管理机构,有很多法律术语和法律框架。这些代码写得不好。法院的判决不能轻易地编码成一个框架。”

“云不够”

和企业一样,政府机构也需要得到正确的工具帮助促进数据科学。国防部负责信息企业的副CIO Peter Ranks表示,数据对他的部门至关重要,尽管国防部IT人员经常谈论云计算、人工智能、网络安全和3c (AI)等技术。指挥、控制和通信)。

“单子上没有数据,”他说。“这是不幸的,因为数据实际上是编织到每一个。如果我们不集中精力从现有数据中获得更多效用,这些活动都不会成功。”

雷恩斯说,未来的战斗将取决于陆、空、海、太空和网络部队协同作战的能力。

“这是一个数据问题,”他说。“我们需要能够与我们的伙伴交流和分享情报。我们需要能够与根据需要创建的联盟共享态势感知数据,并对特定的危机做出反应。”

rank警告说,不要过分强调在数据科学方面依赖云技术。他将云描述为金字塔底部的基础,软件在中间,数据在顶部。

“光有云是不够的,”他说。“云计算不是一种战略。云不是目的地。云不是一个目标。云是一种工具,它是众多工具中的一种,可以实现您的代理努力追求的结果。我们发现,如果我们所做的只是采用云计算,如果我们不使软件现代化,我们所得到的只是在别人的数据中心里使用相同的旧软件。如果我们使软件流程现代化,但不处理数据……我们发现,坏数据变成了一个巨大的船锚,或者所有那些现代化的软件应用程序必须到处运行。我们很难用糟糕的数据进行有效的分析。做一个好的人工智能很难。”

海滩同意了。他说,云计算是USPTO数据战略的“100%”组成部分,但承认人的角色和责任也是如此。

他说:“我们不只是把治理行为看作是一种遵从性的实践,而是在讨论人、过程和技术。”“我们不只是要利用科技来摆脱困境。云只是一个基础步骤。理解数据管理员和数据保管人的角色和职责的识别也很重要。”

这包括帮助确保人们能够找到他们需要的数据,以及拒绝不需要这些数据的人访问。

政府问责办公室(政府Accountability Office)网络安全和数据保护主管尼克·马里诺斯(Nick Marinos)表示,了解自己的数据是确保数据保护和安全的关键一步。

他说:“从安全或隐私的角度来看,事先考虑我们实际上拥有什么数据,我们将这些数据用于什么用途,是最重要的问题。”“最终,在联邦机构内部了解完整的库存,才是真正开始保护企业作为一个整体的途径。”

马里诺斯说,政府机构的数据保护审计通常从该机构的使命和数据流开始。

“只有这样,我们作为审计机构——以及该机构本身——才能强烈意识到这些数据碎片有多少接触点,”他说。“从最佳实践的角度来看,这是第一步。”

深入挖掘数据分析

搜索数据管理
搜索AWS
搜索内容管理
搜索甲骨文
搜索SAP
搜索SQL服务器
关闭