业务信息

数据驱动型企业的技术洞察力
评估 权衡你正在考虑的技术、产品和项目的利弊。

增强分析、自动化工具有助于数据分析

从Tableau到谷歌,供应商越来越多地将增强和自动化分析工具整合到他们的软件中,以加快分析工作,并向更多用户开放。

增强分析听起来很有未来感,BI和高级分析供应商正越来越多地转向……

它在这里 - 现在的现实,以及自动化机器学习,基于搜索的查询和其他具有共同目标的技术,可以简化和简化用户的分析过程。

特别是,增强的分析及其队列旨在使商业用户和不断增长的人口更容易实现所谓的分析公民数据科学家——业务分析师和其他没有接受过正式数据科学培训但自己正在构建预测模型的工作者——深入挖掘数据集,从BI和分析应用程序中获得有价值的见解。

这些新兴的技术确实到达了同一点,但它们来自不同的方向。增强分析——或一些供应商所称的增强智能——嵌入了机器学习算法等BI工具的高级分析功能为了向用户指向相关数据,帮助他们为分析做好准备,并帮助创建数据可视化。另一方面,自动化机器学习平台提供了底层功能,以帮助专业知识有限的分析师建立和训练机器学习模型用于更高级的数据挖掘和预测分析。

但是,虽然简化的推动包含了一系列广泛的工具和方法,但归根结底是让用户——尤其是不那么精通技术的用户——比以前更快地发现信息。TDWI分析师Fern Halper在2017年9月的高级分析趋势报告中写道,这些技术也为更多人参与分析计划铺平了道路,并可以成为组织的“巨大的生产力推进器”。

据Gartner的数据,增强分析包括自然语言处理(NLP)、增强数据准备、自动分析和基于视觉的数据发现。Gartner在其2018年BI和分析平台“Magic象限”报告中表示,总体而言,这些能力尚未成为软件购买决策的主流因素。

但这家咨询和市场研究公司预测,到2020年,增强分析技术“将成为BI工具、嵌入式分析软件和其他产品的主要驱动因素”数据科学和机器学习平台。到那时,Gartner预计50%的分析查询将通过搜索、NLP应用程序或语音命令自动生成或创建,而不是传统的编码。

从长远来看,Gartner认为技术辅助的分析技术正在发展更普遍的。“从现在开始的十年,可能会发现一个商业应用程序,通过机器学习和AI没有以某种方式启用,分析没有不同,”Gartner分析师Rita Sallam在增强分析的最近网络研讨会中表示。

一些用户已经加入了。在2017年6月进行的TDWI调查中,222名受访者中有27%的人表示,他们的组织正在使用向用户提供数据可视化建议的分析工具。TDWI在2018年1月进行的另一项调查显示,387名受访者中有16%的人表示,他们的组织已经部署了自动预测建模软件,另有40%的人表示,他们预计在未来几年内开始使用该软件。

给机器学习气体

雪佛龙公司是谷歌的Cloud AutoML技术的早期采用者,该技术旨在帮助具有有限机器学习专业知识的用户构建和训练分析模型。今年早些时候,雪佛龙的一个地震处理和成像团队使用了阿尔法版本的AutoML Vision图像分析工具来帮助分析内部文件,作为评估石油钻探机会的过程的一部分,该团队的研究地球物理学家Laura Bandura说。

Bandura在7月于旧金山举行的谷歌Cloud Next '18大会的主题会议上说,雪佛龙已经收集了数百万份与不同领域的石油勘探有关的文件,数量太多,无法手工搜索。她解释说,因此,寻找正在评估可能进行钻探的区域的相关信息“可能是大海捞针式的挑战”。

为了精确定位可能有关于墨西哥湾位置的有用地质信息的文件,雪佛龙团队对这个术语进行了搜索地质图找到具有嵌入式地图图像的文档。它下次运行了一个由自动愿景构建的分析模型,并培训以识别超过60个地图图像的地质标签,然后使用谷歌的预先培训的云自然语言API来分类模型找到的数据并进行信息搜索。

商业智能的趋势

班杜拉说,由于使用了AutoML,她和其他雪佛龙勘探人员(用石油行业的术语来说就是这样)现在可以在“几秒钟而不是几周”内找到有关海湾地质的相关文件。她补充说,这使得对可能的钻井地点作出更及时的决定,而不需要数据科学家参与模型的开发和培训过程。

AutoML Vision于去年1月作为alpha技术发布,并于7月发布了测试版,以及用于文本分析和语言翻译的配套产品。同样是在7月,谷歌推出了一个BigQuery ML的beta版本,让用户在公司内部建立机器学习模型BigQuery云数据仓库使用标准SQL命令而不是使用像R,Python和Scala等更高级语言。

更广泛的分析

其他顶级BI和分析供应商也在采用增强分析和其他形式的自动化。Tableau软件例如,它提供了一个推荐引擎,向其自助BI和数据可视化软件的用户推荐相关数据源。它还建立了基于人工智能的模糊聚类算法,帮助用户将相关数据集分组到Tableau准备数据准备工具4月份发布。

今年6月,表收购了AI初创公司Empirical Systems,分析引擎的开发人员可以自动模拟分析数据的数据,并识别数据中的趋势和异常值。它计划将Empirical引擎集成到其BI软件中,希望为用户提供更好的数据洞察。

Tableau的首席产品官Francois Ajenstat表示,该公司也在考虑使用NLP技术,这样商业用户就可以直观地询问有关数据分析的问题,而无需寻求数据科学家的帮助。Ajenstat并没有具体说明何时能实现这一功能,只是说Tableau希望“很快”就能实现这一功能。

Qlik, Tableau的顶层之一自助式BI的竞争对手,同样努力将增强的分析功能合并到其Qlik Sense软件中。今年早些时候Qlik的更新包括添加一个要根据分析师和Insight Advisor工具所选择的数据字段的图表设计的功能,可以将用户指向适合他们想要运行的分析应用程序的数据。

TIBCO软件正在添加使用NLP查询来浏览数据集的能力,并将AI驱动的可视化建议用于其Spotfire自助服务BI软件。那些加入现有AI函数的特征,它是自动识别数据元素之间的关系,是上个月宣布的新Spotfire X版本的一部分,落在秋季的某个时间。

增加艾未未的缓存

其他提供的工具增强分析能力包括Salesforce Einstein和IBM Watson Analytics。此外,IBM上个月详细介绍了对其传统BI平台Cognos Analytics的更新,其中包括自然语言查询、自动模式检测和可视化推荐功能。在其他采用这一概念的BI供应商中,Sisense Inc.正在使用NLP技术来支持一个免费的聊天机器人应用程序,该程序允许用户上传结构化数据,该工具可以分析基本模式、异常检测和其他见解(参见“向你友好的小聊天机器人数据分析师打招呼”)。

Sisense负责战略增长和创新的副总裁盖伊·利维-尤里斯塔(Guy Levy-Yurista)表示,增强和自动化分析技术为人工智能在用户组织中更普遍、更有用提供了一条途径。“人们都对人工智能感到兴奋,但很少有人知道它能做什么,”他说。“分析应该嵌入到你的日常生活中,你应该不加思考地使用分析。”

Sisense战略增长和创新副总裁Guy Levy-Yurista家伙Levy-Yurista

除了谷歌,自动机器学习平台也可以从datarbot等供应商和H2O.ai。微软上个月还为其基于云的Azure机器学习平台添加了一些自动化功能,使该软件能够识别出能够有效运行应用程序的算法,并为用户优化分析模型的性能。

还有很多初创公司都在开发增强工具,比如people。它提供了一个平台,可以用来构建人工智能模型,以加速数据科学应用。MIT创业交易所(MIT Startup Exchange)的许多公司也参与其中,其中约有70家是这样的公司致力于AI项目。Feature Labs就是这样的初创公司之一;它的软件帮助自动化工程特点通过使用自动化技术将原始数据转化为机器学习算法。

跟你友善的聊天机器人数据分析师打个招呼吧

聊天机器人并不是什么新鲜事,但希瑟的博托有点不同。这款免费的聊天机器人可以在Facebook Messenger、Skype和Slack上使用。用户只需将Boto添加到自己的联系人列表中,并使用拖放界面上传机器人可以自动分析的数据,就可以访问Boto。

与数据科学家或其他软件产生的见解相比,Boto产生的见解是相当基础的。莱维-尤里斯塔表示,从本质上讲,宝托的设计目的是向分析机构展示Sisense的产品和普通大众。

自然语言处理在我们的日常生活中越来越普遍。从苹果(Apple)的Siri到亚马逊(Amazon)的Alexa再到微软(Microsoft)的小娜(Cortana),如今越来越多的设备能够理解你的语言,并回答你的问题。

NLP,特别是使用它的聊天,现在是大的,“我们应该看到更多的东西”,levy-yurista表示,并补充说“对机器人的投资是一个先兆的技术”。他相信未来的机器人“将成为代表人类经营的代理人”,并作为“代表你的真正的倡导者”。

这可能意味着机器人将走向世界,或在互联网上为你安排会议,寻找工作并申请工作,甚至可能帮助你进行数据分析和分析。

自动化高级分析过程的软件“允许具有很少的数据科学培训的人成为数据科学家”,“麻省理工学院启动Exchange的计划总监Marcusdahllöf说。因此,增强分析的目的:不熟练的数据科学家的工人至少可以像它们一样行事。

高级执行编辑克雷格·斯特德曼对本文有贡献。

第6条第2条

深入挖掘高级分析软件

获取更多商业信息

能看到我们所有的杂志 查看所有
搜索数据管理
搜索AWS
搜索内容管理
搜索甲骨文
搜索树液
搜索SQL.服务器
关闭