Flume对接Kafka详细过程

一、为什么要集成Flume和Kafka
二、flume 与 kafka 的关系及区别
三、Flume 对接 Kafka（详细步骤）
- (1). Kafka作为source端
- - 1. 配置flume
  - 2. 启动flume
  - 3. 启动Kafka producer
- (2). Kafka作为sink端
- - 1. 配置flume
  - 2. 启动zookeeper集群
  - 3. 启动kafka集群
  - 4.创建并查看topic
  - 5. 创建kafka消费者
  - 6. 启动flume
  - 7. 向flume端口发送消息
  - 8. 在kafka消费者接收信息

一、为什么要集成Flume和Kafka

一般使用 Flume + Kafka 来完成实时流式的日志处理，后面再连接上Storm/Spark Streaming等流式实时处理技术，从而完成日志实时解析的目标。如果Flume直接对接实时计算框架，当数据采集速度大于数据处理速度，很容易发生数据堆积或者数据丢失，而kafka可以当做一个消息缓存队列，当数据从数据源到flume再到Kafka时，数据一方面可以同步到HDFS做离线计算，另一方面可以做实时计算，可实现数据多分发。

二、flume 与 kafka 的关系及区别

Flume

Flume 是一个分布式、高可用的海量日志聚合的系统，支持在系统中定制各类数据发送方，通过监控整个文件目录或者某一个特定文件，用于收集数据；同时Flume也可以将数据写到各种数据接受方，用于转发数据。Flume的易用性在于通过读取配置文件，可以自动收集日志文件，在大数据处理及各种复杂的情况下，flume 经常被用来作为数据处理的工具
flume分为sources，channels，sinks三部分，每一部分都可以根据需求定制。
与kafka相比，flume 可以定制很多数据源，减少开发量，因此做数据采集很好。

Kafka

是由LinkedIn 开发的开源分布式消息系统，主要用于处理LinkedIn 的活跃数据，及日志数据。这些数据通常以日志的形式进行存储，现有的消息队列系统可以很好的用于日志分析系统对于实时数据的处理，提高日志解析效率。
kafka 是分布式消息中间件，自带存储，提供 push 和 pull 存取数据的功能，是一个非常通用消息缓存的系统，可以有许多生产者和很多的消费者共享多个主题

三、Flume 对接 Kafka（详细步骤）

(1). Kafka作为source端

1. 配置flume

a1.sources = r1  
a1.channels = c1  
a1.sinks = k1  
  
a1.sources.r1.type = org.apache.flume.source.kafka.KafkaSource
a1.sources.r1.batchSize = 5000
a1.sources.r1.batchDurationMillis = 2000
a1.sources.r1.kafka.bootstrap.servers = centos1:9092
a1.sources.r1.kafka.topics = mytopic
a1.sources.r1.kafka.consumer.group.id = group1
a1.sources.r1.channels=c1  


a1.channels.c1.type=memory  
a1.channels.c1.capacity=1000  
a1.channels.c1.transactionCapacity=100  


a1.sinks.k1.type=logger  
a1.sinks.k1.channel=c1

2. 启动flume

[hadoop@master1 ~]# flume-ng agent -c /usr/local/src/flume/conf -f /usr/local/src/flume/conf/hdfs_skin.conf -n a1 -Dflume.root.logger=DEBUG,console

3. 启动Kafka producer

[hadoop@master1 ~]# kafka-console-producer.sh --broker-list master1:2181,slave1:2181,slave2:2181 --topic hello

(2). Kafka作为sink端

1. 配置flume

a1.sources = r1
a1.sinks = k1
a1.channels = c1


# netcat 监听端口
a1.sources.r1.type = netcat
a1.sources.r1.bind =master1
a1.sources.r1.port = 10000
a1.sources.r1.channels = c1 
# 一行的最大字节数
a1.sources.r1.max-line-length = 1024000


# channels具体配置
a1.channels.c1.type = memory 
a1.channels.c1.capacity = 1000
a1.channels.c1.transactionCapacity = 100


# KAFKA_sinks
a1.sinks.k1.channel = c1
a1.sinks.k1.type = org.apache.flume.sink.kafka.KafkaSink
a1.sinks.k1.topic = hello
a1.sinks.k1.brokerList = master1:9092,slave1:9092,slave2:9092
a1.sinks.k1.requiredAcks = 1
a1.sinks.k1.batchSize = 20

2. 启动zookeeper集群

[hadoop@master1 ~]# zkServer.sh start

3. 启动kafka集群

[hadoop@master1 ~]# kafka-server-start.sh /usr/local/src/kafka/config/server.properties

kafka后台运行：kafka-server-start.sh /usr/local/src/kafka/config/server.properties 1>/dev/null 2>&1 &

4.创建并查看topic

[hadoop@master1 ~]# kafka-topics.sh --create --zookeeper master1:2181,slave1:2181,slave2:2181 --replication-factor 2 --topic hello --partitions 1

[hadoop@master1 ~]# kafka-topics.sh --list --zookeeper master1:2181,slave1:2181,slave2:2181

5. 创建kafka消费者

[hadoop@master1 ~]# kafal-console-consumer.sh --zookeeper master1:2181,slave1:2181,slave2:2181 --topic hello --from-beginning

6. 启动flume

[hadoop@master1 ~]# flume-ng agent -c /usr/local/src/flume/conf -f /usr/local/src/flume/conf/hdfs_skin.conf -n a1 -Dflume.root.logger=DEBUG,console

7. 向flume端口发送消息

[hadoop@master1 ~]# telnet master1 10000

8. 在kafka消费者接收信息

如有错误，欢迎私信纠正，谢谢支持！

你可能想看：

System Volume Information是什么文件 System Volume Information可以删除吗

有很多朋友们在清理系统的时候遇到一个名为System Volume Information的文件夹，那么这个文件夹到底是什么文件，我们可以清理删除吗？System Volume Information...

Flutter(四)：Flutter 语言 Dart基础使用

一、变量和常量;常量;print('20th century');print(object);name.contains('turn')).forEach(print);四、注释;/* 也可以像这样使...

lumi产品怎么样 lumi酵素怎么样

报道目录：lumi胶原肽饮料怎么样lumi酶怎么样lumi胶原肽饮料怎么样？据我所知，Lumi胶原肽饮料是一种含有胶原肽的饮料，胶原肽被认为有益于皮肤健康和美容。Lumi饮料可能有多种好处，包括提供皮...

有人记得那个穿越来的KFK吗？特朗普好像完犊子了，KFK呢？

所以，谢谢这个人，让我更加珍惜自己的现在，也是因为他，我们对未来都依然抱有希望！

癸酉之变的详细过程？

“癸酉之变”发生在清朝嘉庆十八年（1813年）十月，事件过程不可谓不蹊跷。事件发生时，嘉庆帝正在木兰围场（在今河北省承德市）进行秋狝。事件发生后，嘉庆皇帝感到非常窝囊，他差一点就成了大清的亡国之君。因...

张学良的一生？谁有他的详细过程？

张学良生平之事　　东北易帜　　1919年就读于东三省陆军讲武堂。一年后毕业，在张作霖手下任职，并迅速得到提升。1928年6月3日，张作霖在皇姑屯被日本关东军炸死，张学良就任东三省保安总司令，开始统治东...

q5前座椅套怎么安装视频教程汽车座套的安装方法详细过程解答？

2.汽车用座垫的安装方法：而且，在汽车座垫联合体中有1个或2个带扣，将汽车座垫带扣直接用手插入座椅的间隙中，如果在铺好的汽车座垫前可以将两个小钩环挂在座椅下方的铁条上，则通过座椅的中间间隙使一个带扣通...

[LeetCode] 2133. Check if Every Row and Column Contains All Numbers

Output,Output;false;力扣（LeetCode）链接;https;//leetcode.cn/problems/check-if-every-row-and-column-contai...

使用ReferenceLoopHandling.Ignore序列化依赖于循环的ISerializable对象时，抛出StackOverflowException。

writer.WritePropertyName(serializationEntry.Name);null;member)),我有一个使用二进制序列化来保留数据的旧版应用程序;现在;直到我们遇到了循...

LUA文件是什么？LUA文件如何打开？LUA文件怎么编辑？

lua是一种脚本文件，多见于游戏安装包中，用于实现游戏中一些对性能要求不高，但经常更改的功能。lua本身是文本格式的文件，可以直接用记事本或其他任何文本编辑器打开。但是一般开发者为了防止玩家修改，会对...

Create RAID Volume是什么意思啊

如果我没猜错的话，raid bios已经自动把你的两块盘做成了一个raid,并且，只有一个volume。这时你再开辟另一个volume，当然没有空间了，怎么办呢？很简单，你移动高亮选择条到“删除现有...

《抖音》volumeshader_bm网站地址介绍

2、大家可以通过该网址来检测自己的手机或者电脑的性能，但是如果设备配置比较差的话会比较容易卡死。

PG-13，147958-06-3，Seminalplasmin Fragment (SPF) Analog/SPFK

氨基酸组成分析≤±10%

网页报错Message: date: It is not safe to rely on the system's timezone settings. You are *required* to use the date.timezone s

实际上，从 PHP 5.1.0 ，当对使用date()等函数时，如果timezone设置不正确，在每一次调用时间函数时,都会产生E_NOTICE 或者 E_WARNING 信息。而又在php5.1.0...

ME2022下载ME2022中文版Adobe Media Encoder 2022安装WIN版

Adobe Media Encoder 2022 v22.0.0.107软件摄取、转码、创建代理并输出您可以想象的任何格式。这个强大的媒体管理工具允许您跨应用程序以统一的方式处理媒体。与 Adobe ...

“name”是“名字”，那“name names”是啥意思？

家人们，最近上网课、在线办公呢吗？线上签到，点名总有吧？还记得以前上学那会儿，老师是真点名签到啊。点名回答“到”用英语怎么说？被老师点名字回答“到”，其实是告诉老师“我在，我来上课了，我出席了”。作为...

fl studio 21打不开，FL工程文件也打不开怎么办？

FL Studio 21全称Fruity Loops Studio，就是大家熟悉的水果编曲软件，一个全能的音乐制作软件，包括编曲、录音、剪辑和混音等诸多功能，让你的电脑编程一个全能的录音室。FL St...

flac是什么格式？flac格式音频转换mp3格式的方法介绍！

可以通过闪电音频格式转换器实现，操作方法比较简单适合新手使用。我们在日常生活中，如果追求音质的话一般都会选择flac格式的音频；不过考虑到内存问题，我们会直接将flac格式转换为mp3格式，毕竟mp3...

华硕fl5900u驱动程序文件(华硕fl5900u光驱)

还有出色的屏幕、强劲的性能和军规级别的安全性。但新款转轴优化后终于支持了。展开 B 面后就能看到一块兼具准确色彩和高分高刷的好屏了，这块屏的具体素质IT之家会在下文详细测试，专业的剪辑师键盘往往会搭载...

电脑中使用谷歌浏览器打开flash提示adobe flash player已被屏蔽如何解决

使用谷歌浏览器的时候避免不了会碰到各种各样的问题，例如近日有用户在电脑中使用使用谷歌浏览器的时候，发现打开flash就提示adobe flash player已被屏蔽，导致无法正常查看flash内容，...

标签: 陈勋奇盲区汤加丽油腻日志

分享给朋友：

问答百科

Flume对接Kafka详细过程

一、为什么要集成Flume和Kafka

二、flume 与 kafka 的关系及区别

三、Flume 对接 Kafka（详细步骤）

(1). Kafka作为source端

1. 配置flume

2. 启动flume

3. 启动Kafka producer

(2). Kafka作为sink端

1. 配置flume

2. 启动zookeeper集群

3. 启动kafka集群

4.创建并查看topic

5. 创建kafka消费者

6. 启动flume

7. 向flume端口发送消息

8. 在kafka消费者接收信息

Copyright © 2024 问答百科网 All Rights Reserved.
蜀ICP备11000655号-9