机器学习应用增加AWS热度

日期:2016-5-10作者:Alan R. Earls翻译:滕晓龙 来源:TechTarget中国 英文

【TechTarget中国原创】

机器学习建模曾经是一项较为复杂的任务,一般只有优秀的数学家才能胜任。但是AWS和其他几家公司正试图让企业也能使用这项技术。

亚马逊机器学习是一个提供可视化工具和应用向导的AWS云服务,它能够帮助开发人员为机器学习用例进行建模。至此,使用简单API通过应序进行预测就变成了一件相对简单的事情了。亚马逊和它的一些竞争对手正在这一原本需要特殊编程和数学技能的挑战性领域进行比赛,以便让几乎任何人都可以使用这项技术。

“信息分析是每一家企业在2016年都计划要做的事,”一家总部位于纽约市的AWS托管服务合作伙伴企业Logicworks公司的高级副总裁兼CTO Jason McKay说。“亚马逊机器学习是AWS将原本复杂、昂贵、通常也是缓慢的应用通过使用他们自己团队开发的工具变成更易于和便于使用的服务产品的又一例证。”

这些服务所采用的算法都是亚马逊公司数据科学家和亚马逊电子商务业务长期以来一直在内部使用的,一家总部位于加州Santa Monica的AWS咨询合作伙伴CorpInfo公司的云解决方案架构师Laith Al-Saadoon解释说。这些算法每天都支持着数十亿美元的实时和批量操作预测业务。

这项服务采用了一种所用即所付的付费方式,因此也就没有前期许可或使用承诺之类的限制。用户可以根据实际资源请求来支付费用,从而避免必须做出硬件或软件的承诺,Saadoon指出。根据他的估计,学习曲线变化应当是较为平缓的。只要管理员或数据分析师理解AWS的生态系统——例如Kinesis、Redshift和关系型数据库服务——学习曲线就很少会出现比较陡峭的情况。IT团队可以通过使用亚马逊机器学习加快探索和试验的步伐,从而缩短产品上市时间,他补充说。

机器学习用例与竞争

机器学习——特别是亚马逊机器学习,比传统分析方法更迈进了一步,因为它更侧重于预测和潜在指令性结果。亚马逊机器学习并不如其他的一些机器学习选项那样成熟。例如,训练数据集的容量被限制在100GB以下,而实际批量预测数据集则被限制在1TB以下。

当然,也有很多替代选择。也许最有名的是IBM公司的Watson Analytics,它通过一个简单的“对话”界面提供了数据可视化和预测分析功能。微软公司的Azure机器学习工作室提供了可适应多种机器学习用例的现成示例库。无论如何, Saadoon都对亚马逊的这款产品情有独钟并表示,该产品的使用仅受到用户想象力的限制。

例如,大多数机构都希望更好地理解客户在他们网站上的各种用户行为,从而优化用户的访问体验或吸引用户的关注。机器学习和预测分析可以使用简单存储服务(S3)或Redshift来分析点击流数据,并对如用户更愿意点击哪里这样的问题进行针对性的分析。根据这些概率数据,管理员或数据分析师就可以把这些点击推向一个优选的最终状态,例如指向收银台。

亚马逊机器学习还可用于推荐引擎应用。“很多垂直行业都可从中受益,例如有个APP可向客户推荐可访问哪家餐厅,”Saadoon说。在这个例子中,用户可以输入她的年龄、性别和位置等信息,然后机器学习服务就可以将其数据与类似人群进行比较,从那些个体和类似数据中提取适合该类人群的业务。这一过程可以被广泛用于客户决策。

挪威的一位博主Arne Sund在他的博文中写了许多亚马逊机器学习有趣用例中的一个,将该服务应用于天气预测——或者至少预测某个城市的当地温度。他指出,Oslo的天气模式通常来自于西方,他的训练数据集中囊括了来自于诸如Stavanger和Bergen等城市的观察结果。在使用历史数据进行机器学习之后,Sund发现这项服务能够根据新数据来分析产生一个对所在城市温度大致精确的预测。

“使用亚马逊机器学习服务并使用真实生活数据来对其进行测试是非常有趣一件事,”Sund在一篇博文中写道。

小小的应用障碍

现在,用于分析的数据需要驻留在AWS资源中,Saadoon指出,“这是亚马逊机器学习所面临的一个挑战;它只能与S3相连进行对象存储,使用Redshift作文数据仓库以及提供传统SQL关系型数据库功能的关系型数据库服务。”

但是,更愿意使用其他数据源的数据分析师可以使用亚马逊弹性MapReduce和一个开源机器学习系统(例如Apache Spark)。“你可以使用这一组合连接到几乎所有的Hadoop数据源,”他说。

建立亚马逊机器学习是非常简单的,Saadoon说。对于最终用户来说,他们甚至能够使用API进行自然语言查询。

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

评论
查看更多评论

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

作者>更多

Alan R. Earls
Alan R. Earls

TechTarget资深作者

云计算和大数据>更多

  • 华大基因:BT+IT引领物种学科的新开工

    BT和IT融合,为基因组学这个重要的生物学分支奠定了基础。所谓基因组学(英文名称Genomics),就是研究生物基因组、研究如何利用基因的一门学问。它涉及基因测序、基因作图、基因组功能分析等。

  • Oracle IaaS 2.0:支持最大规模、最苛刻的数据库负载

    在甲骨文第2代企业级IaaS云技术大会,甲骨文公司副总裁及北方区总经理孟文波也说,“未来的世界,数据是最有价值的,数据的革命将会是第四次革命中最重要的基础。

  • 移动互联网:企业如何在大数据的野蛮生长中掘金?

    随着全球移动设备、可穿戴设备等智能设备的不断增多,我们看到大数据的数量也不断增长,而且是爆发式的增长。IDC的一份报告预测,到2020年,大数据和业务分析市场将增长至203亿美元,是2015年1120亿美元的两倍。

  • 特朗普经济:2017年IT渠道商机大家谈

    随着步入2017年,IT渠道分析师和高管们都形成了一个共识:变革就在眼前。过去一年,许多渠道合作伙伴都实施了大胆的措施来改变他们的业务,从而促进其收入增加。

相关推荐

  • 评估公共云中机器学习服务

    自从科幻电影中出现了不停闪烁和嘟嘟响的电脑之后,机器学习就被视为计算的未来。今天,未来就在这里,因为机器学习——特别是在云上,变得越来越实用,对企业IT来说也越来越实惠。

  • 云机器学习仍然悬而未决

    谷歌公司的母公司Alphabet的主席Eric Schmidt在一年前召开的首届谷歌云大会上曾预测说,机器学习将在五年内成为每一家主流IPO的基本功能。

  • 聊天机器人中的两把技术之火:AI和机器学习

    由于chatbot技术—模拟会话语言或文本人际交互的软件——变得越来越普遍,应用开发人员还需要获得另一个领域的专业知识。

  • 谷歌云平台展望更高级别服务

    谷歌公司一方面降价一方面还增加了大量的新功能,以试图缩短其与AWS之间的距离,它展望公共云未来并宣称将推出更高级的服务。

技术手册>更多

  • 也谈应用和云集成

    应用集成从1980年代中期就已经成为企业软件的痛点,也是那个时候我第一次开始做IT报道。同样的老问题让不同的软件共存,大部分是因为业主权益要比开放标准高。

  • 云平台选择与部署指南

    云计算应用落地是一个很漫长的过程。在部署云计算之前,用户必须认识各个平台供应商及其云平台,然后根据自身架构选择合适的云平台投入运营。

  • 混合云管理实战技术手册

    虽然有关云计算的探讨大部分是关于隐私、成本和安全问题,但是很多IT专家认为混合云模式给出了云计算的优势和风险之间的最佳平衡点。近期的TechTarget Cloud Pulse调查中我们发现39%的企业使用云计算,但是部署的是混合云,相比较而言,目前有22%的企业部署私有云,40%使用公有云。但是现在很多企业还是处于一种迷糊状态,如何才能实现更好的混合云部署,如何能够管理混合云?在这本技术手册中很多业界的专家针对混合云给出了一些建议,供参考。

  • 企业私有云选型完全手册

    虽然云计算发展的春天已经来临,但是众多企业仍然希望保持对IT环境和物理资源的控制。通常情况下,法律或法规会阻止企业实施从数据中心到公共云计算的转变。这就成全了私有云计算,它允许企业在本地管理硬件,同时又允许最终用户远程访问基础设施的下一个逻辑步骤。尽管每个IT环境都是独一无二的,但是对你的私有云计算项目实现从规划到投产有很多可供借鉴的最佳实践案例,其中包括选择正确的管理程序、软硬件以及合适的广域网和宽带技术。在这本技术手册中,我们将会关注企业私有云选型以及如何落地。

TechTarget

最新资源
  • 安全
  • CIO
  • SOA
  • 虚拟化
  • 网络
  • 数据中心