[搜文档] Flume - 搜索结果 - 书栈网

书栈网 · BookStack 本次搜索耗时 0.026 秒，为您找到 328 个相关结果.

3.技术选型

1844 2018-04-11 《大数据实验手册》

3.Hadoop部署技术选型一、背景介绍二、社区版本与第三方发行版本的比较三、第三方发行版本的比较四、选择决定 3.Hadoop部署技术选型一、背景介绍生产环境中，hadoop的版本选择是一个公司架构之时，很重要的一个考虑因素。 Apache Hadoop：Apache Hadoop是一款支持数据密集型分布式应用并以Apac...
大数据学习路线

5300 2019-12-08 《大数据入门指南》

大数据学习路线一、大数据处理流程 1.1 数据收集 1.2 数据存储 1.3 数据分析 1.4 数据应用 1.5 其他框架二、学习路线 2.1 语言基础 1. Java 2. Scala 2.2 Linux 基础 2.3 构建工具 2.4 框架学习 1. 框架分类 2. 学习资料 3. 视频学习资料三、开发工具 ...
使用 Kudu 开发应用程序

3510 2019-06-16 《Apache Kudu 1.4.0 中文文档》

使用 Kudu 开发应用程序使用 Kudu 开发应用程序查看 API 文档 C++ API 文档 Java API 文档工作实例 Maven Artifacts ( Maven 工件 ) Impala命令使用 Kudu 的例子 Kudu 与 Spark 集成 Spark 集成已知问题和限制 Kudu Python 客户端与 Map...
扇出流

950 2020-04-05 《Flume 1.8用户手册中文版》

扇出流扇出流如前面章节所述，Flume支持流的扇出形式配置，就是一个source连接多个channel。有两种扇出模式，复制和多路复用。在复制模式下，source中的Event会被发送到与source连接的所有channel上。在多路复用模式下，Event仅被发送到部分channel上。为了分散流量，需要指定好source的所有chan...
传输数据编码格式

324 2020-07-28 《Bigflow Python 1.0.0 文档》

传输数据编码格式背景编码格式使用场景&实例分析现有编码方式及改进传输数据编码格式本文档描述了一种编码算法, 可以把多路/多种分组方式的多条数据流编码成一条Key/Value数据流. 该算法用于跨Task的数据传输和归并. 背景关于计算和数据模型, 请先参见 Flume-Core . 在逻辑执行计划中, 根据算法的需求, 我...
Input

406 2020-07-28 《Bigflow Python 1.0.0 文档》

Input Input 定义所有的数据源(Source)，用于Pipeline.read()方法实现一个Source需要实现四个接口：有一个input_format属性，是一个flume::Loader 有一个objector属性，是一个Objector 有一个uris属性，返回一个uri列表有一个transform_from_node方...
Flink Data Source

2334 2019-12-08 《大数据入门指南》

Flink Data Source 一、内置 Data Source 1.1 基于文件构建 1.2 基于集合构建 1.3 基于 Socket 构建二、自定义 Data Source 2.1 SourceFunction 2.2 ParallelSourceFunction 和 RichParallelSourceFunction 三、Str...
平滑迁移 HDFS 到 JuiceFS

581 2022-01-16 《JuiceFS 云服务版 v4.6.0 分布式文件系统教程》

平滑迁移 HDFS 到 JuiceFS 方案一：修改 LOCATION 准备阶段数据迁移阶段反向迁移方案二：不修改 LOCATION 准备阶段数据迁移阶段反向迁移平滑迁移 HDFS 到 JuiceFS 大数据平台在不同存储系统之间进行数据迁移通常都是一个大工程，要怎么做到尽量不影响上层业务是一个问题。借助 JuiceFS 特...

3.技术选型

大数据学习路线

使用 Kudu 开发应用程序

扇出流

传输数据编码格式

Input

Flink Data Source

平滑迁移 HDFS 到 JuiceFS