助人就是助己:IBM宣布大规模资助开源大数据项目Spark
2022-10-23 05:55:49 来源:
本周一,IBM宣布将对开源实时大数据分析项目ApacheSpark进行大规模资助,蓝色巨人宣称,其资助的力度之大相当于每年数亿美元的投入。
Hadoop技术出自Google、Yahoo这些互联网公司,主要是为了对规模庞大的各类数据进行处理和分析。不过近年来随着大数据应用的流行,越来越多的公司也希望自己具备类似的能力,这使得Hadoop逐步进入了主流。Hadoop以及相关的分发企业如Cloudera, Hortonworks等也成为了大数据领域的投资热点。
Spark同样也提供大数据处理与分析能力。如果说Hadoop胜在规模的话,那么Spark就胜在速度。这项由2年前UC Berkeley AMP实验室开发的技术将中间输出结果保存在内存而不是分布式文件系统中,从而可以提供实时的数据分析能力。与Hadoop获得的资助相比,对Spark的支持还很不够。
正是在此背景下IBM宣布了对Spark的大规模资助。蓝色巨人将投入超过3500名开发者到Spark相关项目,为项目提供机器学习技术,并将Spark嵌入到IBM的数据分析和商用软件中,同时还会把Spark作为服务在它的Bluemix开发平台上提供出来。为了鼓励基于Spark的创新,IBM还将在旧金山设立一个Spark技术中心。IBM还将把自己的一个研究项目SystemML开源。这个项目是利用机器学习技术去识别数据模式,而它正是在Spark基础上开发的。
IBM还计划与UC Berkeley的AMPLab、DataCamp、Galvanize以及Big Data University等学术及教育组织合作提供Spark教育课程,目标是培养100万名数据工程师和数据科学家。
IBM的大规模资助令人瞩目。回顾过去,正是由于IBM的出手才让若干关键技术得到了普及,比如说1980年代IBM对PC的投入,2000年代对Linux的投入均加速了相关技术成为主流的进程。
当然,对于IBM来说,对Spark的大规模投入实际上也在帮助它自己。此举不仅能强化自己在大数据领域的地位,同时也能吸引更多开发者加盟它的生态体系,帮助IBM更快更好地解决其业务问题。
而放眼更大的环境,开源化已成不可逆转的趋势。技术巨头比以往任何时候都更加热情地涌入到这一潮流当中。比方说Google开源了自己最大的秘密之一,Facebook更是几乎将自己变成了一所开源实验室。因为这些巨头明白,如果不拥抱开源,也许就会被开源消灭。
原创文章,作者:boxi
铁路总公司:400对系列复兴号集中上线2019年春运
(原标题:400对系列复兴号 集中上线2019年春运) 图:全国铁路调度指挥中心。本报记者 陈磊摄 图:南京南动车所的工作人
2022-10-23 04:02
度小满CEO朱光:金融科技要先解决风险问题,再解决效率问题
网易科技讯10月20日消息,在第六届乌镇互联网大会金融科技论坛上,度小满金融(原百度金融)CEO朱光表示,互联网金融经历了这几年的发展,
2022-10-22 20:27
惨烈!春节7天这里将上演一场13亿元的战争
(原标题:惨烈!春节7天 这里将上演一场13亿元的战争) 9。9元起,《功夫瑜伽》魔性开挂,《西游伏妖篇》在淘票票15。8元起特惠抢票
2022-10-22 19:56
汽车之家Q4净利润1.565亿美元同比增长38.70%
网易科技讯 2月26日消息,汽车互联网服务平台汽车之家发布了截至2018年12月31日未经审计的2018年第四季度及全年财报。 2018年第四
2022-10-22 01:23
2009中国互联网领袖扑克牌-邓裕强
关键词:机遇 2008年——2009年邓裕强大事记: 2008年9月22日:邓裕强:SP在明年复苏无望 无线互联网将井喷 2009年1月7日:3G门户邓
2022-10-21 16:03