【云栖大会】再谈开源大数据

  • 时间:
  • 浏览:4

2016杭州云栖大会在云栖小镇召开,本届大会以“飞天・进化”为主题,内容规模比去年翻倍,从原先2天的议程增加至3天,从10月13日持续到16日,超过200场主题演讲使开发者们对阿里云计算生态发展和应用趋势、前沿技术和产品有了更深刻的了解。

木艮:Hadoop存储与计算分离实践

范文臣:Deep dive into catalyst

在2016杭州云栖大会第3天的“开源大数据技术专场”分会场上,范文臣、Intel 研发经理郑锴、逸晗网络科技大数据平台负责人杨智、 Intel技术专家毛玮、阿里云技术专家木艮围绕开源大数据技术为当让我们哦做了精彩的分享。

为你你这个必须存储计算分离、分离后的性能为什么我么我会 样,做了你你这个优化,适应你你这个场景?是木艮在本次演讲中我想知道们的内容。

杨智:梨视频基于E-MapReduce大数据推荐系统 

本次演讲范文臣从 Catalyst 的基本概念开使,深入讲解了 Catalyst 提供了你你这个主要特征来支持 Spark 的 API 抽象。

毛玮从流避免的核心概念,到功能的完备性,全方位对比了目前比较热门的流避免框架:Spark Streaming, Flink,Storm和Gearpump。一同从吞吐量个延时兩个 方面,对各个平台进行了性能评估。

阿里在09年就开使尝试使用Hadoop技术,先后包括Hadoop、Spark、Hbase及Jtorm,你你这个开源技术在不同的业务线广泛使用,推动阿里业务的发展。本论坛第一次聚集了阿里Hadoop、Spark、Hbase、Jtorm各领域的技术专家,讲述Hadoop生态的过去现在未来及阿里在Hadoop大生态领域的实践与探索。本论坛还发布了阿里云E-MapReduce交互式产品。

郑锴首先回顾了最近一两年Hadoop社区对HDFS 纠删码的支持,介绍EC对用户的价值,适用场景和部署建议。有时候 重点思考了Hadoop社区在HDFS后边接下来会为什么我么我会 走,介绍当前在做的好多个重要特征,探讨大数据存储的发展趋势,一同也希望跟用户有效互动得到更多反馈。

毛玮:分布式流避免框架:功能对比及性能评估

内容包括逸晗网络科技的数据实时统计、数据避免平台、推荐实时反馈、推荐模型&排序机器学习模型训练和更新等。

郑锴:HDFS下一步新思考:在支持了纠删码时候