本次搜索耗时 0.019 秒,为您搜索到 11 个相关结果.
  • Spark 编程指南简体中文版

    Apache Spark 是专为大规模数据处理而设计的快速通用的计算引擎。Spark是UC Berkeley AMP lab (加州大学伯克利分校的AMP实验室)所开源的类Hadoop MapReduce的通用并行框架,Spark,拥有Hadoop MapReduce所具有的优点;但不同于MapReduce的是——Job中间输出结果可以保存在内存中,从而不再...
  • Spark GraphX源码分析

    Spark GraphX是一个新的Spark API,它用于图和分布式图(graph-parallel)的计算。GraphX 综合了 Pregel 和 GraphLab 两者的优点,即接口相对简单,又保证性能,可以应对点分割的图存储模式,胜任符合幂律分布的自然图的大型计算。
  • spark性能调优总结

    Apache Spark 是专为大规模数据处理而设计的快速通用的计算引擎。Spark是UC Berkeley AMP lab (加州大学伯克利分校的AMP实验室)所开源的类Hadoop MapReduce的通用并行框架,Spark,拥有Hadoop MapReduce所具有的优点;但不同于MapReduce的是——Job中间输出结果可以保存在内存中,从而不再...
  • Databricks Spark 知识库

    Databricks Spark 知识库简体中文版
  • smack4中文文档

    Smack是一个用于和XMPP服务器通信的类库,可以实现即时通讯和聊天。Smack是Spark项目的核心。
  • spark机器学习算法研究和源码分析

    本项目对spark ml包中各种算法的原理加以介绍并且对算法的代码实现进行详细分析,旨在加深自己对机器学习算法的理解,熟悉这些算法的分布式实现方式。
  • [英文]Spark Gotchas

    Unless explicitly stated otherwise this document is applicable to: - Apache Spark 2.0 or later. - Scala 2.11. - Python 3.5 or later.
  • Databricks Spark Reference Applications(英文)

    At Databricks, we are developing a set of reference applications that demonstrate how to use Apache Spark. This book/repo contains the reference applications.
  • Apache Phoenix使用文档(英文)

    Apache Phoenix 为 Apache Hadoop 提供基于 SQL 的 OLTP 和运营分析,使用 Apache HBase 作为其后备存储,并提供与 Apache 生态系统中其他项目的集成,如 Spark、Hive、Pig、Flume和 MapReduce 。
  • Mesos 中文文档(数人云 用户手册)

    “数人云”云操作系统,是一款部署在公有云或者私有云(IDC)之上的应用运维软件,旨在帮助用户在云端快速建立并稳定运维一个高性能生产环境。 通过数人云,用户可以快速部署海量的Docker应用,在保障高可用的同时实现秒级的快速伸缩能力。快速搭建并运维Spark、Hadoop MR、Kafka等等集群化应用,并且保证服务资源和数据均为用户私有。