百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术资源 > 正文

Python日志写入ES之五种方案比较

off999 2024-11-23 20:49 22 浏览 0 评论

?实时/准实时方案可以使用以下四种方式实现

  • flume+kafka+spark准实时写入ES
  • logging + CMRESHandler实时写入ES
  • 利用python中的Elasticsearch库实时写入ES
  • pyinotify后台监控文件变化写入ES

定时写入方案则有

  • 超时重试及定时批量写入ES

接下来我将比较这几个方案的区别,及实现定时写入ES方案。

flume+kafka+spark实时写入ES

此方案流程为:通过flume采集日志,上送到kafka,接着spark程序订阅Topic并消费日志,然后写入ES。因为消息存在一定的滞后,所以叫准实时。对于数据量超大的场景,或同时需要利用spark做日志分析场景,一般采用此方案,目前公司使用的就是这样一套系统,但存在很多问题。目前随着集群上应用越来越多,资源可能不够用,导致程序偶尔会挂掉,另外kafka数据消息偶尔延时以及丢失问题,最终决定弃用本方案(项目对日志有精确要求,日志语料需要导出标注)

logging + CMRESHandler实时写入ES

另一种实时写入方案是:利用logging配合es写入模块做实时写入操作

环境安装

pip install CMRESHandler

简易使用方式
CMRESHandler支持的参数很多,配合logging可以方便进行日志写入管理,若想配置更简单,可以安装loguru,基本用法如下:

使用kibana查看写入结果

注意:实际的索引默认以天为单位(可以修改),写入内容包括主机名,ip等信息。

利用python中的Elasticsearch库实时写入ES

除了以上方案外,还可以使用python中的ElasticSearch包,调用index接口写入(当然也可以自己构造request请求写入),
首先要安装elasticsearch

pip install elasticsearch


写入用法如下

使用kibana查看写入结果


可以看出,写入内容简洁很多。

以上2种实时方案看起来不错,但也存在几个问题。

  • 数据丢失问题
    若ES集群某段时间出现异常,或某个客户端节点不可用,数据存在丢失的风险
    网络异常造成访问超时,同样存在数据丢失风险
  • 并发写入性能问题
    高并发写入ES库,对ES的性能要求造成很大挑战,同时会降低应用的并发能力(若使用异步线程问题倒不大)

pyinotify后台监控文件变化写入ES

为了应对高并发及网络异常情况,可以选择利用pyinotify后台监控,这样既能实时,又能在出错时将文件存在本地。

安装

pip install pyinotify


使用方式如下

向文件/tmp/1.log中写入内容:

echo “222” >> /tmp/1.log


程序打印:

222

可以看出,程序能实时检测到文件变化,若日志并发写入要求不是很高,则可以考虑此方案,但同时需要注意监控过程中程序中断问题,中断前需要存储pos位置,方便程序重启后读取,而不是从头开始再写入一次

自定义超时重试请求及定时批量写入ES

综合业务(对实时性要求不高,允许短暂延迟)需求,和当前集群情况(一个ES集群,2个数据节点,2个客户端节点),决定采用定时写入方案。实现步骤和特点如下:

  • 后台进程每隔3秒检测日志目录
  • 根据上次读取位置获取最新日志并写入
  • 获取上次重试失败日志并再次写入

后台进程每隔3秒检测日志目录

日志目录结构为:

- logs

+ visit
- visit_20191117
- position_info

+ warn

+ bury

其中visit为访问日志,warn为告警日志,bury为埋点日志。
position_info存放上次读取的日志文件和位置信息,内容如下:
{“last_day_file_name”: “visit_20191117”, “position”: 73709}

根据上次读取位置获取最新日志并写入

这里需要注意几个问题

  • 读取日志过程中另外进程写入,会造成最后一行数据不完整的问题。因此需要做完整性校验,比如判断是不是完整的json结构。
  • 写入网络异常问题。写入要重试2次,若失败,则保存下来,下次再继续写入。
  • 写入过程中断程序(数据已发送),接收写入结果失败,下次重写数据导致重复问题。因此要写入唯一性的日志id(日志写入本地时就需要确定)

自定义重试写入代码:

由于需要验证,因此在Header中加入Authorization字段,一般格式如:“Authorization: Basic jdhaHY0=”,其中Basic表示基础认证, jdhaHY0=是base64编码的"user:passwd"字符串。
同时要注意批量写入(_bulk)时,各数据行要以\n结尾

唯一性的日志id
一般使用python自带的uuid来生成,使用方式也很简单:

数据完整性校验
项目中日志格式为json,因此使用eval做校验,若这行出现问题,则记录上一行的位置。

最后总结一下:
本文介绍了4种实时/准实时写入ES方案和定时写入ES方案,并比较了各种方案的使用场景和优缺点。并根据项目特点,最终选择并实现了定时写入方案(又造了个轮子。。。),大家可以根据项目特点来实现,以上供大家参考。

相关推荐

手机cpu排名一览表(手机cpu排名前十)

第一名:苹果:A151、A15Bionic采用4颗效率核心+2颗性能核心的组合,搭配4核心GPU,集成85亿个晶体管,性能提升了大约20%。2、苹果称其为“智能手机中最快的CPU”,有着“智能手机...

系统补丁怎么安装(系统补丁在哪)

1成后,需要打sp1补丁,不过微软对win7的支持已经结束了,建议升级新系统2到微软官网/zh-cn/download找到win7系统版本的补丁,点击下载3勾选对应系统版本4确认无误后,点击Next5...

win10命令行窗口怎么打开(window10命令行窗口)

调出运行命令的方法如下1:同时按下win+R,在打开的运行对话框中输入:cmd后,回车打开。2:也可以在同时按下win+x,或者“开始”菜单上右键,在弹出菜单上选择“命令行提示符”或“命令提示符(管理...

windows7屏幕亮度怎么调整(windows7屏幕亮度调节)

windows7屏幕亮度调节方法如下1.鼠标右键桌面空白处,在弹出的菜单中选择【个性化】。2.进入属性界面,选择左下角的【显示】选项。3.在弹出的显示页面右侧点击【调整亮度】。4.进入调整亮度页面,下...

永久删除的视频怎么找回(怎么恢复永久删除的视频)
  • 永久删除的视频怎么找回(怎么恢复永久删除的视频)
  • 永久删除的视频怎么找回(怎么恢复永久删除的视频)
  • 永久删除的视频怎么找回(怎么恢复永久删除的视频)
  • 永久删除的视频怎么找回(怎么恢复永久删除的视频)
xpsp2系统下载地址(windows xp sp2 iso)

WindowsXPProfessionalSP2产品密钥是微软公司的一个软件密钥,用于授权用户使用该软件的完整功能。它通常与产品许可证一起使用,用于确保软件的合法性和安全性。使用Windows...

开机microsoft登录不上

1、系统问题:如果系统版本比较低,可能会由于旧系统存在某些BUG未修复或业务功能未优化,使手机在使用APP等应用过程中出现卡的情况,建议更新到最新的ios系统使用。2、内存问题:如果内存比较小,在运行...

如何取消win10开机密码(如何取消win10开机密码账户登录)

取消Windows10的开机密码可以通过以下方法进行操作:方法一:使用用户账户设置1.打开“开始”菜单,点击“设置”图标。2.在设置窗口中,点击“帐户”选项。3.在左侧菜单中,选择“登录选项”。4....

免费解压文件的软件(免费解压文件的软件电脑)

1、快压快压(kuaizip)是一款非常流氓的压缩和解压缩软件,一款免费、方便、快速的压缩和解压缩利器,拥有一流的压缩技术,是国内第一款具备自主压缩格式的软件。快压自身的压缩格式KZ具有超大的压缩比和...

无线usb网卡插上去没有反应(为什么usb无线网卡插上去没反应)

当出现电脑无法识别无线网卡的情况时,是简单的方法就是将无线USB网卡插到电脑后置USB接口上,以保证供电的充足。当然如果是偶然出现无法识别的情况,建议重启一下电脑试试。启用USB无线网卡驱动:右击“计...

怎么登录自己家的路由器(怎么登录自己家的路由器账号)

登陆家里的路由器方法:1、先查看ip,方法:win+r---输入:cmd---在再黑白界面输入:ipconfig,按回车。2、根据网关查看路由器地址。若网关是:192.168.2.1,那么路由器的ip...

linux操作系统安装步骤(linux系统详细安装步骤)

1.选择“中文(简体)”,然后点击“安装Ubuntu”。2.点击“继续”。3.然后点击“现在安装”。4.选择地址的时区,然后点击“继续”。5.选择“汉语”,然后点击“继续”。6.输入用户的名字。7.设...

苹果手机怎么设置定时关机(苹果手机怎么设置定时关机重启)

苹果手机可以设置定时关机,但无法设置定时开机。具体操作步骤如下:进入苹果手机自带的时钟。点击屏幕有下角的计时器。点击画面中间的计时结束启用选项。选择画面最下方的“停止播放”。之后再点击画面右上角的设定...

无线网wifi密码忘记了怎么办

忘记wifi密码后,可以在路由器后台查看。1.在浏览器的地址栏中,输入路由器上的管理地址,进入后台界面;2.在后台界面里,找到“无线设置”选项,点击它;3.在新界面里,点击wifi密码右侧的小眼睛图标...

win7系统无法正常开机怎么办
win7系统无法正常开机怎么办

解决方法如下1,出现无法启动的原因,要注意是开机启动不了,还是在进度条那里缓冲,过不去.如果是开机启动不了,那就要看一下内存条、电源等有没有问题?如果是在进度条那里,那就看下方的三种方法。2,第一种方法:1,开机按F8键.2,选择最近一次的...

2025-11-16 07:51 off999

取消回复欢迎 发表评论: