大数据自动化分析和开源

日期:2014-8-19作者:张培颖来源:TechTarget中国

【TechTarget中国原创】

现在Apache的开源Storm可能是大数据自动化分析最大的话题了,Storm是一个分布式实时计算系统,按照Storm作者的说法,Storm对于实时计算的意义类似于hadoop对于批处理的意义。在2011年Storm开源之前,Hadoop的大红大紫,让整个业界对于大数据的热情高涨。Hadoop的高吞吐,海量数据处理的能力使得人们可以方便地处理海量数据。但是,Hadoop的缺点也和它的优点同样鲜明——延迟大、响应缓慢、运维复杂。不过根据Forrester最近的调查,我们发现商用厂商在开源Storm也有相关的产品和服务提供。

Storm被广泛应用于实时分析,在线机器学习,持续计算、分布式远程调用等领域。目前Storm已经为一些高调的企业所应用,比如Weather Channel、Spotify和Twitter,但是Forrester的调查中发现,即便如此,这个极为技术性的平台却缺乏更高级的工具以及自动化运行器,而这些则由需要厂商的产品平台来提供。

在七月份的大数据自动化分析平台报告中,Forrester回顾了主要的七个平台:IBM、Informatica、SAP、Software AG、SQLstream、TIBCO和Vitria,总共评估的项目多达50条,包括业务应用和平台集成、数据源、开发工具、执行能力、合作伙伴以及价格等。

如果大数据自动化分析这样的词汇让人感到过于前沿化的话,也需要注意的是一些实时的数据可能会成就或者破坏业务。比如,供应链领导商希望利用实时数据响应制造、交付或者召回问题。对于那些依赖市场数据进行决策制定的产业也很有用。

企业如果要自己制定一个实时的计算系统,要解决很多问题。主要有五方面的问题,低延迟,既然是实时计算系统,延迟一定要低。另外就是高性能,性能如果不够高的话对于机器就是一种浪费。再者是要维持分布式特性,系统都是为应用场景而生的,如果你的应用场景、你的数据和计算单机就能搞定,那么不用考虑这些复杂的问题了。我们所说的是单机搞不定的情况。可扩展。伴随着业务的发展,企业的数据量、计算量可能会越来越大,所以这个系统的可扩展性必须能够保证。最后还要考虑容错的问题,这是分布式系统中通用问题。一个节点不工作了不能影响整体的应用。

物联网、移动化和一些潜在的事件数据也都可能为这些工具创造更多的需求。这份报告中也提供了一些实际应用大数据自动化分析的公司案例,同时将这些部署主要分成三个比较宽泛的领域:实时可视化业务、检测紧急情况以及自动化瞬时行动。毫无疑问在这份报告中,领导的厂商主要是IBM、Informatica、SAP等,他们的解决方案更为成熟。

这份报告也指出初创公司,比如DataTorrent和Continuuity的代号为jetStream的产品也已经加入到自动化分析的市场中,但是二者都旨在Hadoop内部运行。此外IBM也提供了自己对于这个领域的评估。

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

评论
查看更多评论

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

作者>更多

张培颖
张培颖

云计算网站编辑

云计算和大数据>更多

技术手册>更多

  • 云存储市场求生指南

    云存储对于一系列的存储需求是一种有效的选择。理解各种云存储系统的关键特性有助于识别合适的用例,并避免潜在且昂贵的错误。在这本技术手册中,我们将着重关注云存储市场动态,以及目前的价格情况,同时关注企业在选择云存储服务时需要注意哪些问题,有哪些可供参考的内容。

  • OpenStack实战指导手册

    本技术手册我们将侧重介绍OpenStack的最新动态,以及如何用OpenStack构建云计算,同时我们在最后引入拉美最大在线电子交易网站MercadoLibre的实战,看他们如何用OpenStack开发云存储业务。

  • 混合云迁移与管理指导

    很多供应商都称可以提供私有云或公共云产品。但却少有供应商表示能够提供混合云计算。尽管现在很多人呼吁使用混合云,但是一些IT管理者关心的还是把所有的生产应用移交给第三方是否会损失本地基础架构的实质投入。在这样的案例中,混合环境可以利用公有云和私有云的好处。

  • 避免云厂商锁定秘技

    厂商锁定问题不仅给企业产生的巨大的额外成本,对于企业来说还业务管理的灵活性,扩展性也大大降低。基于种种问题,IT管理人员频繁地使用云服务,以此作为摆脱厂商锁定的一种方式。但如何真正避免厂商锁定,一直都是用户在思考的问题。

TechTarget

最新资源
  • 安全
  • CIO
  • SOA
  • 虚拟化
  • 网络
  • 数据中心