Kafka中Broker节点磁盘问题的故障处理方法-Linux大棚

admin 管理员组

文章数量: 1086019

2024年4月14日发(作者：前端开发岗位要求)

２０２０年７月１０日

现代信息科技

第４卷第１３期

Modern Information Technology

Jul.2020

Vol.4

No.13

DOI:10.19850/.2096-4706.2020.13.047

Ｋａｆｋａ中Ｂｒｏｋｅｒ节点磁盘问题的故障处理方法

汪涛

（

中移

（

苏州

）

软件技术有限公司

，

江苏苏州 215163

）

摘要

：

Apache Kafka作为一种分布式的消息队列中间件

，

由于其具有高可靠性

、

高吞吐量

、

可持久化

、

可扩展性好

等特点

。

在大数据项目中

，

如日志聚合

、

流数据处理等应用场景中被广泛使用

。

由于Kafka的消息需要持久化到磁盘中

，

磁盘

故障会影响Kafka的使用

，

严重时会造成数据丢失

。

所以基于Kafka的存储特性

，

通过复盘和分析由于磁盘问题导致的Kafka

集群故障

，

提出了一系列的磁盘故障处理方法

，

从而缩短Kafka集群故障的恢复时间

。

关键词

：

Kafka

；

分布式

；

消息队列

；

磁盘故障

；

处理方法

中图分类号

：

TQ587.22

；

TP309.3 文献标识码

：

A 文章编号

：

2096-4706

（

2020

）

13-0148-03

Ｔｒｏｕｂｌｅｓｈｏｏｔｉｎｇ　Ｍｅｔｈｏｄ　ｆｏｒ　Ｄｉｓｋ　Ｐｒｏｂｌｅｍ　ｏｆ　Ｂｒｏｋｅｒ　Ｎｏｄｅ　ｉｎ　Ｋａｆｋａ

WANG Tao

（China Mobile（Suzhou） Software Technology Co.，Ltd.，Suzhou 215163，China）

data persistence

Abstract：

Apache Kafka is a distributed middleware used for message queue. It has merits of high reliability，high throughput，

，good scalability，and therefore has be widely used in big data project such as log aggregation，streaming data processing

and so on. The messages of Kafka are persisted to disk，so Kafka is not work when its disk malfunction. Some severe cases may result in

subsequent loss of data. Therefore，based on the storage characteristics of Kafka，this paper proposes a series of methods to deal with the

failure of Kafka cluster through the re-disk and analysis of Kafka cluster failure caused by disk problems，so as to shorten the recovery

time of Kafka cluster failure.

Keywords：

Kafka；distributed；message queue；disk malfunction；solution

0 引言

Kafka作为一种分布式的消息队列中间件

，

部署多采用

Apache Kafka

[1]

，

最初由LinkedIn公司开发

，

并于2011

若干节点构成集群的方式

。

在这个Kafka集群中

，

每个节点

年开源

[2]

。

2012年被孵化成为Apache软件基金会顶级项目

。

被称作Broker

，

可以理解为Kafka提供服务的一个实例

。

在

如今

，

Kafka应用于众多大数据项目中

，

很多互联网公司也

消息

（

message

）

队列系统中

，

通常都会有生产者

（

Producer

）

在自己的生产环境中将Kafka作为消息中间件使用

。

发送消息

，

消费者

（

Consumer

）

消费消息

，

这样就构成了一

个消息

“

流水线

”

的上下游

，

如图1所示

。

每条被Producer

1 Kafka组件及架构

发布到Kafka集群的消息都属于一个Topic

。

Producer

message

Broker

message

Topic1

Consumer

Topic

Broker

1Topic2

Topic3

图1 消息

“

流水线

”

2 Kafka中的文件存储介绍

在存储层面

，

任何发布到此分区的消息都会被追加

Topic经过Producer发布到Kafka集群中

，

这条Topic

（

append

）

到数据文件的尾部

，

文件以

“

.log

”

为后缀

。

消

会根据配置被划分为多个分区

（

Partition

），

这些分区又会

息被追加到分区中因为是顺序写入

（

write

）

磁盘的

，

因此效

被均匀地分布到Kafka集群所有的Broker节点上

。

这样做

率非常高

。

如图2所示

，

图中不同颜色的数据文件对应的是

可以通过增加分区的数量来横向增加Topic的存储数据量

，

不同的分区数据

，

append操作正在写入对应虚线数据文件

。

并且均匀分布也可以起到负载均衡的作用

。

除了log文件

，

分区中还有一个以

“

.index

”

为后缀的

索引文件

，

它们共同组成段

（

Segment

）

文件

。

在分区中会

存在多个段文件

，

它们大小相等

，

但其中包含的消息数不一

收稿日期

：

2020-06-20

定相等

。

这种特性方便旧的段文件可以被快速删除

，

这样可

148

2020.7

现代信息科技7月13期.indd 1482020/9/4 19:44:31

汪涛：Kafka 中Broker节点磁盘问题的故障处理方法

第13期

以清理空间供新的消息进行存储

，

提高磁盘利用率

。

点的磁盘发生故障

，

导致这个Broker节点的进程退出

[3]

，

作为分布式系统

，

Kafka在设计上也充分考虑了高可用

，

进而影响了Kafka中的某一个Topic的正常使用

。

从Broker的多节点到Topic的多副本

。

Topic的副本机制则

如果启用副本

，

Kafka至少不会因为单个节点不能对外

是通过分区的副本实现的

，

被称为Replica

，

即在另一个或

服务而发生Topic不能正常使用的情况

，

这就是Topic的高

多个Broker节点上存在这个分区的副本

。

可用性

。

本次故障影响使用的主要原因就是Topic没有设置

Segment

Partition 0Partition 1Partition 2

副本

，

采用系统默认值1

。

在Broker节点发生磁盘故障停止

ﬁle

000

old

服务时

，

由于这个Topic在故障Broker的分区没有可以使用

111

的副本

，

导致了此Topic不能正常写入和消费数据的问题

。

222

当发生磁盘故障

，

通常快速恢复Kafka服务的方法就是

333

修改Kafka的ties配置中参数

，

将故障

444

磁盘从配置中删除

，

Broker就可以启动了

。

Broker启动之后

，

节点上故障磁盘的分区会在此Broker的其他磁盘中创建

。

但

new

对于这次的Kafka故障还遇到了下文提到的两种意外情况

。

3.1 启动时触发了特定版本Kafka的bug

writes

启动Broker时

，

日志出现异常报错

，

显示读取index文

图2 Partition的append操作

件损坏

，

不能启动

，

如图3所示

。

遇到这种问题时一般是删

3 故障复盘与分析

除抛出异常的index文件

。

index文件存放的元数据指向对应的log文件中消息的

在公司某生产环境里的Kafka集群中

，

一个Broker节

物理偏移地址

，

如图4所示

。

图3 Kafka抛出的异常日志

Message3786800

Message378681

138

，

Message378682

345

，

345

Message378683

522

，

1407

Message378684

832

，

1682

Message378685

1407

，

1927

Message378686

1501

…

Message378687

1682

，

position

Message378688

1800

Message378689

1927

……

Message378679+Nposition

图4 Kafka中index文件与log文件的对应关系

那为什么index会发生损坏呢

这是因为index文件是

启动的问题

，

在0.9版本中对此问题进行了修复

[5]

，

处理的

一个索引文件映射

，

它不会对每条消息都建立索引

，

而是间

逻辑是自动清理这个文件后重建

，

不抛出异常

。

隔indexIntervalBytes大小之后才写入一条索引条目

，

所以是

3.2 转移的分区将磁盘空间写满

一个稀疏文件

。

Kafka运行时会创建一个.

将故障磁盘从配置文件中删除后重新启动Broker

，

故

bytes大小的index文件

，

向其中写入稀疏索引

，

内容达到阈

障磁盘中所有Topic的分区副本会在剩余磁盘中重新创建

，

值后会进行滚动覆盖

。

根据社区jira的内容

[4]

，

在Kafka非

并同步消息数据

，

此时出现了多个大数据量的分区副本被放

正常退出后会出现index损坏的情况

，

而在0.8及以前版本

，

入同一个磁盘中

，

导致磁盘空间被迅速写满

。

这种情况下

，

Kafka在读取这个损坏的index文件后会出现报错退出无法

就不能再使用剔除磁盘的方法了

。

紧急处理时可以采取缩短

2020.7

149

现代信息科技7月13期.indd 1492020/9/4 19:44:31

第13期

现代信息科技

Topic的保存时间

，

从物理上减小Topic数据大小

，

然后分

如图6所示

。

阶段删除磁盘中过期数据

，

最后重启Broker节点恢复

。

4 实验验证

对于磁盘故障这类服务器常见问题

，

如何能将故障对

Kafka集群的影响减少至最低是研究的重点

。

对此总结了如

下的恢复步骤

，

并通过实验进行了验证

，

可供参考使用

。

4.1 紧急恢复故障时可以剔除故障磁盘后重启

Step1

：

删除Kafka配置文件conﬁg/ties中损

坏的磁盘

（

例如data2为故障磁盘

，

原配置为

：“

data0/Kafka-logs,/data1/Kafka-logs,/data2/Kafka-logs,/data3/

”，

更改后配置为

：“

=/data0/Kafka-logs,/

图5 测试创建的分区

data1/Kafka-logs,/

”）。

Step2

：

重启Kafka进程

。

结果

：

原

“

/data2/Kafka-logs,

”

目录下的分区会被重新

分配到当前Broker的其他磁盘上

。

影响

：

会产生数据倾斜的情况

，

大数据量的分区叠加到

同一个磁盘

，

可能造成个别磁盘被写满

。

4.2 最小化影响恢复故障

集群可允许一个Broker下线时

，

可暂不重启Kafka进程

，

待磁盘更换完成后直接重启Kafka进程

。

如果当前Broker有多余的一块磁盘作备盘

。

当Kafka进

程下线时

，

修改配置文件conﬁg/ties

（

例如data2

为故障磁盘

，

data9为备盘

，

原配置为

：“

=/data0/

图6 转移之后的分区

Kafka-logs,/data1/Kafka-logs,/data2/Kafka-logs,/data3/Kafka-

5 结论

”，

替换后配置为

：“

=/data0/Kafka-logs,/data1/

Kafka-logs,/data9/Kafka-logs,/

”，

用data9

本文描述了在磁盘损坏后导致Kafka集群出现的几种异

，

替换data2

），

直接启动Kafka进程

。

之后在最近的系统维

常情况提出了在这些情况下的几种故障处理方法

，

并通过

护周期时间点更换坏盘

。

实验进行模拟验证

。

这些方法可以应用于日常运维Kafka集

群的工作中

，

有效提高了Kafka集群可用性

，

为避免数据丢

4.3 具体实验验证过程

失提供了参考方案

。

环境

：

测试集群共3个Broker

（

Broker1至Broker3

），

参考文献

：

每个主机上挂载5块磁盘

（

data0至data4

）。

Kafka配置文

[1]

KREPS J，NARKHEDE N，:Adistributied

件conﬁg/ties配置了4块磁盘

，

即data0

、

data1

、

messaging system for log processing [C]//Proceedings of the NetDB’11.

data2

、

data3

，

data4作为备盘

。

[S.l.：s.n.]，2012：129-140.

Step1

：

新建测试Topic为testKafka

，

配置分区为12

，

[2]

GOODHOPE K，KOSHY J，KREPS J，et a1． Building

副本数为2

。

此时分区均匀分布

，

每个Broker中8个分区

。

LinkedIn’s Real—time Activity Data Pipeline [J]．Data Engineering，

Step2

：

测试Topic testKafka

，

进行正常的信息生产和消

2012，35：33-45.

费

，

此时查看Broker3中data3目录下面文件

，

存在2个分区

，

[3]

ASF JIRA. Shutdown Kafka when there is any disk IO error [EB/

如图5所示

。

OL].（2011-07-19）./jira/browse/KAFKA-55.

Step3

：

直接删除data3目录

，

模拟磁盘故障

，

Kafka进

[4]

ACHANTA V S. Corrupt index after safe shutdown and

程退出

。

此时

，

修改Kafka配置文件conﬁg/ties

，

restart [EB/OL].（2014-11-20）./jira/browse/

将data3换成data4

，

即四块磁盘变成了data0

、

data1

、

data2

、

KAFKA-1791.

data4

。

[5]

PALINO T. Broker should automatically handle corrupt index

files [EB/OL].（2015-03-09）./jira/browse/

Step4

：

上述步骤完成后

，

重启Broker3服务

，

此时会发

KAFKA-2012.

现消费Topic数据时会有短暂告警打印

，

后续恢复正常

。

作者简介

：

汪涛

（

1990

—），

男

，

汉族

，

江西九江人

，

工程师

，

结果

：

磁盘data3中的2个分区转移到备用磁盘data4中

，

硕士

，

研究方向

：

系统运维

。

150

2020.7

现代信息科技7月13期.indd 1502020/9/4 19:44:32

本文标签：磁盘故障分区消息

版权声明：本文标题：Kafka中Broker节点磁盘问题的故障处理方法内容由网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：http://www.roclinux.cn/b/1713093441a619513.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

Linux大棚 – 不忘初心的技术博客，浮躁时代的安静角落

Kafka中Broker节点磁盘问题的故障处理方法

更多相关文章

win10重装系统打开分区或者磁盘提示无法访问解决办法

mac high sierra开机按option怎么只有一个磁盘_Mac重装系统系列教程(二)：网络在线重装系统...

linux怎样删除分区合并,linux u盘分区合并分区工具重复歌曲怎样删除

Windows访问Linux的Ext4格式磁盘

文件损坏 无法删除 怎么使用chkdsk磁盘修复工具

电脑修复后，一直进行磁盘检查，导致启动很慢（已解决）

安装Windows系统时手动对硬盘进行分区

2012服务器清理系统盘,windows2012磁盘清理

Windows登录、锁屏的判定以及消息捕捉

安装操作系统前硬盘如何分区与格式化

安装Win 10或Win 11到新加装的NVME固态硬盘，无法找到NVME硬盘或磁盘处于脱机状态

MFC 响应windows系统睡眠休眠和重启关机注销的消息

win7下创建逻辑分区

windows10隐藏分区（隐藏efi系统分区）

计算机管理 未分配磁盘,磁盘显示未分配怎么办？

电脑磁盘设置为只读怎么办

WinEyes的重新实现--windows系统及其消息机制

Linux 与windows之间目录或磁盘映射操作

Windows10 子系统(WSL) 或 docker wsl 模式 修改虚拟磁盘目录

ChatGPT发不出去消息？我找到了解决方法！

发表评论

推荐文章

git - How to download a specific GitHub folder without its subdirectories? - Stack Overflow

javascript - HTML Doctype SettingIE Quirks Mode - Stack Overflow

How can I troubleshoot requests to an Azure Container App? - Stack Overflow

Azure Function app (python) deployment from github actions gives module not found - Stack Overflow

javascript - How to add custom component inside an Flatlist in React Native? - Stack Overflow

热门文章

python - How do I save a dynamax GussianHMM model? - Stack Overflow

angular - When I hover my chart (from Apexcharts) &quot;[object Object]&quot; appears - Stack Overflow

javascript - Ember &quot;this&quot; undefined in component - Stack Overflow

android - Apple Authentication Callback Returns Undefined User Data in passport-apple - Stack Overflow

kubernetes - Forwarding CF-IPCountry Header to Backend with NGINX Ingress and Cloudflare - Stack Overflow

Google play login page popup automatically when open my Android App while user not login system account - Stack Overflow

Animating items in a SwiftUI list only at first appearance - Stack Overflow

c++ - How to make the widgets contained in QMainWindow occupy all the available space - Stack Overflow

c# - How can I fire a Button Click event when Enter Key is pressed based on what textbox has focus? - Stack Overflow

jquery - get the hostname(Base URL) using javascript - Stack Overflow

最新文章

javascript - How do I toggle the readonly attribute of all child element with jquery - Stack Overflow

javascript - Might it be possible to block an entire US state from accessing my site, using PHP? - Stack Overflow

c++ - Is dereferencing std::span::end always undefined? - Stack Overflow

javascript - Delay function execution if it has been called recently - Stack Overflow

javascript - Google Maps Autocomplete List - Stack Overflow

windows设置断电重启开机后自动输入锁屏密码登录

Windows系统设置开机默认开启数字小键盘

Windows11 开机自动同步时间（开机时间不更新问题）

windows配置开机自启动软件或脚本

【Redis】Windows设置Redis为开机自启动

Exploring the Finest Accommodations: A Comprehensive Guide to Ruston LA Hotels

The Enchanting Experience of ScaliniTella NYC: A Culinary Gem in the Heart of Manhattan

Exploring the Exquisite Aloft Chicago O'Hare: A Blend of Modern Luxury and Convenience

A Culinary Journey: Discovering the Finest Dining Experiences in Waco, TX

A Culinary Journey: Discovering the Finest Dining Experiences in Athens, GA

文件损坏无法删除怎么使用chkdsk磁盘修复工具

计算机管理未分配磁盘,磁盘显示未分配怎么办？

Windows10 子系统(WSL) 或 docker wsl 模式修改虚拟磁盘目录

angular - When I hover my chart (from Apexcharts) "[object Object]" appears - Stack Overflow

javascript - Ember "this" undefined in component - Stack Overflow