Python自动化运维实战:从Linux系统中收集数据
off999 2024-12-13 15:37 18 浏览 0 评论
使用Linux命令可以查看当前系统状态和运行状况的相关数据。然而,单个Linux命令和应用程序只能获取某一方面的系统数据。我们需要利用Python模块将这些详细信息反馈给管理员,同时生成一份有用的系统报告。
我们将报告分为两部分。第一部分是使用platform模块获取的一般系统信息,第二部分是硬件资源,如CPU和内存等。
首先从导入platform模块开始,它是一个内置的Python库。platform模块中有很多方法,它们可用来获取当前运行Python命令的操作系统的详细信息。
import platform
system = platform.system()
print(system)
上述代码的运行结果如下。
该脚本返回当前系统的类型,同样的脚本在Windows系统上运行会得到不同的结果。当它在Windows系统上运行时,输出结果就变成Windows。
常用的函数uname()和Linux命令(uname -a)的功能一样:获取机器的主机名、体系结构和内核信息,但是uname()采用了结构化格式,以便通过序号来引用相应的值。
import platform
from pprint import pprint
uname = platform.uname()
pprint(uname)
上述代码的运行结果如下。
system()方法获得的第一个值是系统类型,第二个是当前机器的主机名。
使用PyCharm中的自动补全功能可以浏览并列出platform模块中的所有可用函数,按Ctrl + Q组合键就可以查看每个函数的文档(见下图)。
然后,使用Linux文件提供的信息列出Linux机器中的硬件配置。这里需要记住,在/proc/目录下可以访问CPU、内存以及网络等相关信息;我们将读取这些信息并在Python中使用标准的open()函数访问它们。查看/proc/目录可以获取更多信息。
下面给出具体的脚本。
首先,导入platform模块,它仅在当前任务中使用。
#!/usr/bin/python
__author__ = "Bassim Aly"
__EMAIL__ = "basim.alyy@gmail.com"
import platform
然后,定义函数。以下代码包含了本次练习中需要的两个函数——check_feature()和get_value_from_string()。
def check_feature(feature,string):
if feature in string.lower():
return True
else:
return False
def get_value_from_string(key,string):
value = "NONE"
for line in string.split("\n"):
if key in line:
value = line.split(":")[1].strip()
return value
最后是Python脚本的主要部分,其中包括用来获取所需信息的Python代码。
cpu_features = []
with open('/proc/cpuinfo') as cpus:
cpu_data = cpus.read()
num_of_cpus = cpu_data.count("processor")
cpu_features.append("Number of Processors: {0}".format(num_of_cpus))
one_processor_data = cpu_data.split("processor")[1]
print one_processor_data
if check_feature("vmx",one_processor_data):
cpu_features.append("CPU Virtualization: enabled")
if check_feature("cpu_meltdown",one_processor_data):
cpu_features.append("Known Bugs: CPU Metldown ")
model_name = get_value_from_string("model name ",one_processor_data)
cpu_features.append("Model Name: {0}".format(model_name))
cpu_mhz = get_value_from_string("cpu MHz",one_processor_data)
cpu_features.append("CPU MHz: {0}".format((cpu_mhz)))
memory_features = []
with open('/proc/meminfo') as memory:
memory_data = memory.read()
total_memory = get_value_from_string("MemTotal",memory_data).replace("kB","")
free_memory = get_value_from_string("MemFree",memory_data).replace("kB","")
swap_memory = get_value_from_string("SwapTotal",memory_data).replace("kB","")
total_memory_in_gb = "Total Memory in GB:
{0}".format(int(total_memory)/1024)
free_memory_in_gb = "Free Memory in GB:
{0}".format(int(free_memory)/1024)
swap_memory_in_gb = "SWAP Memory in GB:
{0}".format(int(swap_memory)/1024)
memory_features =
[total_memory_in_gb,free_memory_in_gb,swap_memory_in_gb]
这部分代码用来输出从上一节的代码中获取的信息。
print("============System Information============")
print("""
System Type: {0}
Hostname: {1}
Kernel Version: {2}
System Version: {3}
Machine Architecture: {4}
Python version: {5}
""".format(platform.system(),
platform.uname()[1],
platform.uname()[2],
platform.version(),
platform.machine(),
platform.python_version()))
print("============CPU Information============")
print("\n".join(cpu_features))
print("============Memory Information============")
print("\n".join(memory_features))
在上面的例子中我们完成了以下任务。
(1)打开/proc/cpuinfo并读取其内容,然后将结果存储在cpu_data中。
(2)使用字符串函数count()统计文件中关键字processor的数量,从而得知机器上有多少个处理器。
(3)获取每个处理器支持的选项和功能,我们只需要读取其中一个处理器的信息(因为通常所有处理器的属性都一样)并传递给check_feature()函数。该方法的一个参数是我们期望处理器支持的功能,另一个参数是处理器的属性信息。如果处理器的属性支持第一个参数指定的功能,该方法返回True。
(4)由于处理器的属性数据以键值对的方式呈现,因此我们设计了get_value_from_string()方法。该方法根据输入的键名通过迭代处理器属性数据来搜索对应的值,然后根据冒号拆分返回的键值对,以获取其中的值。
(5)使用append()方法将所有值添加到cpu_feature列表中。
(6)对内存信息重复相同的操作,获得总内存、空闲内存和交换内存的大小。
(7)使用platform的内置方法(如system()、uname()和python_version())来获取系统的相关信息。
(8)输出包含上述信息的报告。
脚本输出如下图所示。
另一种呈现数据的方式是利用第5章中介绍的Matplotlib库,可视化随时间变化的数据。
11.1.1 通过邮件发送收集的数据
从上一节生成的报告中可以看到系统中当前的资源。在本节中,我们调整脚本,增强其功能,比如,将这些信息通过电子邮件发送出去。对于网络操作中心(Network Operation Center,NOC)团队来说,这个功能非常有用。当某个特殊事件(如HDD故障、高CPU或丢包)发生时,他们希望被监控系统能够自动给他们发送邮件。Python有一个内置库smtplib,它利用简单邮件传输协议(Simple Mail Transfer Protocol,SMTP)从邮件服务器中发送和接收电子邮件。
使用该功能要求在计算机上安装本地电子邮件服务器,或者能够使用免费的在线电子邮件服务(如Gmail或Outlook)。在这个例子中我们将使用SMTP登录Gmail网站,将数据通过电子邮件发送出去。
接下来,开始动手修改脚本,为其添加SMTP功能。
将所需模块导入Python,这次需要导入smtplib和platform。
#!/usr/bin/python
__author__ = "Bassem Aly"
__EMAIL__ = "basim.alyy@gmail.com"
import smtplib
imp ort platform
下面是check_feature()和get_value_from_string()这两个函数的代码。
def check_feature(feature,string):
if feature in string.lower():
return True
else:
return False
def get_value_from_string(key,string):
value = "NONE"
for line in string.split("\n"):
if key in line:
value = line.split(":")[1].strip()
return value
最后是Python脚本的主体,其中包含了获取所需信息的Python代码。
cpu_features = []
with open('/proc/cpuinfo') as cpus:
cpu_data = cpus.read()
num_of_cpus = cpu_data.count("processor")
cpu_features.append("Number of Processors: {0}".format(num_of_cpus))
one_processor_data = cpu_data.split("processor")[1]
if check_feature("vmx",one_processor_data):
cpu_features.append("CPU Virtualization: enabled")
if check_feature("cpu_meltdown",one_processor_data):
cpu_features.append("Known Bugs: CPU Metldown ")
model_name = get_value_from_string("model name ",one_processor_data)
cpu_features.append("Model Name: {0}".format(model_name))
cpu_mhz = get_value_from_string("cpu MHz",one_processor_data)
cpu_features.append("CPU MHz: {0}".format((cpu_mhz)))
memory_features = []
with open('/proc/meminfo') as memory:
memory_data = memory.read()
total_memory = get_value_from_string("MemTotal",memory_data).replace("kB","")
free_memory = get_value_from_string("MemFree",memory_data).replace("kB","")
swap_memory = get_value_from_string("SwapTotal",memory_data).replace("kB","")
total_memory_in_gb = "Total Memory in GB:
{0}".format(int(total_memory)/1024)
free_memory_in_gb = "Free Memory in GB:
{0}".format(int(free_memory)/1024)
swap_memory_in_gb = "SWAP Memory in GB:
{0}".format(int(swap_memory)/1024)
memory_features =
[total_memory_in_gb,free_memory_in_gb,swap_memory_in_gb]
Data_Sent_in_Email = ""
Header = """From: PythonEnterpriseAutomationBot <basim.alyy@gmail.com>
To: To Administrator <basim.alyy@gmail.com>
Subject: Monitoring System Report
"""
Data_Sent_in_Email += Header
Data_Sent_in_Email +="============System Information============"
Data_Sent_in_Email +="""
System Type: {0}
Hostname: {1}
Kernel Version: {2}
System Version: {3}
Machine Architecture: {4}
Python version: {5}
""".format(platform.system(),
platform.uname()[1],
platform.uname()[2],
platform.version(),
platform.machine(),
platform.python_version())
Data_Sent_in_Email +="============CPU Information============\n"
Data_Sent_in_Email +="\n".join(cpu_features)
Data_Sent_in_Email +="\n============Memory Information============\n"
Data_Sent_in_Email +="\n".join(memory_features)
下面给出连接到gmail服务器所需的信息。
fromaddr = 'yyyyyyyyyyy@gmail.com'
toaddrs = 'basim.alyy@gmail.com'
username = 'yyyyyyyyyyy@gmail.com'
password = 'xxxxxxxxxx'
server = smtplib.SMTP('smtp.gmail.com:587')
server.ehlo()
server.starttls()
server.login(username,password)
server.sendmail(fromaddr, toaddrs, Data_Sent_in_Email)
server.quit()
在前面的例子中实现了以下功能。
(1)第一部分与上一个例子相同,只是没有将数据输出到终端,而是将其添加到Data_Sent_in_Email变量中。
(2)Header变量表示电子邮件标题,包括发件人地址、收件人地址和电子邮件主题。
(3)使用smtplib模块内的SMTP()类连接到公共Gmail SMTP服务器并完成TTLS连接。这也是连接Gmail服务器的默认方法。我们将SMTP连接保存在server变量中。
(4)使用login()方法登录服务器,最后使用sendmail()函数发送电子邮件。sendmail()有3个输入参数——发件人、收件人和电子邮件正文。
(5)关闭与服务器的连接。
脚本输出如下图所示。
11.1.2 使用time和date模块
到目前为止,我们已经能将从服务器中生成的自定义数据通过电子邮件发送出去。但由于网络拥塞、邮件系统故障或任何其他问题,生成的数据与电子邮件的传递时间之间可能存在时间差,因此我们不能根据收到电子邮件的时间来推算实际生成数据的时间。
出于上述原因,需要使用Python中的datetime模块来获取被监控系统上的当前时间。该模块可以使用各种字段(如年、月、日、小时和分钟)来格式化时间。
除此之外,datetime模块中的datetime实例实际上是Python中独立的对象(如int、string、boolean等),因此datetime实例在Python中有自己的属性。
使用strftime()方法可以将datetime对象转换为字符串。该方法使用下表中的格式符号来格式化时间。
修改脚本,将下面的代码段添加到代码中。
from datetime import datetime
time_now = datetime.now()
time_now_string = time_now.strftime("%Y-%m-%d %H:%M:%S")
Data_Sent_in_Email += "====Time Now is {0}====\n".format(time_now_string)
在这段代码中,首先从datetime模块中导入datetime类。然后使用datetime类和now()函数创建time_now对象,该函数返回系统的当前时间。最后使用带格式化符号的strftime()来格式化时间并将其转换为字符串,用于输出(注意,该对象包含了datetime对象)。
脚本的输出如下。
11.1.3 定期运行脚本
在脚本的最后一步,设置运行脚本的时间间隔,它可以是每天、每周、每小时或某个特定的时间。该功能使用了Linux系统上的cron服务。cron用来调度周期性的重复事件,例如,清理目录、备份数据库、转储日志或任何其他事件。
使用下面的命令可以查看当前计划中的任务。
crontab -l
编辑crontab需要使用-e选项。第一次运行cron时,系统会提示你选择自己喜欢的编辑器(nano或vi)。
典型的crontab由5颗星组成,每颗星代表一个时间项(见下表)。
如果需要每周五晚上9点运行某个任务,可以使用下面的配置。
0 21 * * 5 /path/to/command
如果需要每天0点运行某条命令(比如备份),使用这个配置。
0 0 * * * /path/to/command
另外,还可以让cron以某个特定时间间隔运行。如果需要每5min运行一次命令,可以使用这个配置。
*/5 * * * * /path/to/command
回到脚本,如果我们期望它每天早上7:30运行,使用这个配置。
30 7 * * * /usr/bin/python /root/Send_Email.py
最后,记得在退出之前保存cron配置。
最好使用绝对路径的Linux命令,而不是相对路径,以避免出现任何潜在的问题。
本文摘自《Python自动化运维实战》
本书旨在讲述通过Python简化运维、提升运维效率的方法和实践。
本书首先介绍如何开发Python程序 、创建Python模块,然后讲述如何使用Python工具获取重要的输出信息、生成通用的配置模板、自动安装操作系统、配置大量服务器,最后讨论如何创建和管理虚拟机,如何利用OpenStack、VMware、AWS自动执行管理任务等。
通过本书,你将掌握用Python实现自动化运维的各种方法和技巧。
本书主要内容:
- Python中常用模块的用法;
- 通过Python脚本管理网络设备的方法;
- 使用Ansible和Fabric自动执行常见的Linux管理任务的方法;
- 使用Python管理VMware、OpenStack和AWS实例的方法;
- 基于Python的安全工具的用法。
相关推荐
- Linux 网络协议栈_linux网络协议栈
-
前言;更多学习资料(包含视频、技术学习路线图谱、文档等)后台私信《资料》免费领取技术点包含了C/C++,Linux,Nginx,ZeroMQ,MySQL,Redis,fastdfs,MongoDB,Z...
- 揭秘 BPF map 前生今世_bpfdm
-
1.前言众所周知,map可用于内核BPF程序和用户应用程序之间实现双向的数据交换,为BPF技术中的重要基础数据结构。在BPF程序中可以通过声明structbpf_map_def...
- 教你简单 提取fmpeg 视频,音频,字幕 方法
-
ffmpeg提取视频,音频,字幕方法(HowtoExtractVideo,Audio,SubtitlefromOriginalVideo?)1.提取视频(ExtractVi...
- Linux内核原理到代码详解《内核视频教程》
-
Linux内核原理-进程入门进程进程不仅仅是一段可执行程序的代码,通常进程还包括其他资源,比如打开的文件,挂起的信号,内核内部的数据结构,处理器状态,内存地址空间,或多个执行线程,存放全局变量的数据段...
- Linux C Socket UDP编程详解及实例分享
-
1、UDP网络编程主要流程UDP协议的程序设计框架,客户端和服务器之间的差别在于服务器必须使用bind()函数来绑定侦听的本地UDP端口,而客户端则可以不进行绑定,直接发送到服务器地址的某个端口地址。...
- libevent源码分析之bufferevent使用详解
-
libevent的bufferevent在event的基础上自己维护了一个buffer,这样的话,就不需要再自己管理一个buffer了。先看看structbufferevent这个结构体struct...
- 一次解决Linux内核内存泄漏实战全过程
-
什么是内存泄漏:程序向系统申请内存,使用完不需要之后,不释放内存还给系统回收,造成申请的内存被浪费.发现系统中内存使用量随着时间的流逝,消耗的越来越多,例如下图所示:接下来的排查思路是:1.监控系统中...
- 彻底搞清楚内存泄漏的原因,如何避免内存泄漏,如何定位内存泄漏
-
作为C/C++开发人员,内存泄漏是最容易遇到的问题之一,这是由C/C++语言的特性引起的。C/C++语言与其他语言不同,需要开发者去申请和释放内存,即需要开发者去管理内存,如果内存使用不当,就容易造成...
- linux网络编程常见API详解_linux网络编程视频教程
-
Linux网络编程API函数初步剖析今天我们来分析一下前几篇博文中提到的网络编程中几个核心的API,探究一下当我们调用每个API时,内核中具体做了哪些准备和初始化工作。1、socket(family...
- Linux下C++访问web—使用libcurl库调用http接口发送解析json数据
-
一、背景这两天由于一些原因研究了研究如何在客户端C++代码中调用web服务端接口,需要访问url,并传入json数据,拿到返回值,并解析。 现在的情形是远程服务端的接口参数和返回类型都是json的字符...
- 平衡感知调节:“系统如人” 视角下的架构设计与业务稳定之道
-
在今天这个到处都是数字化的时代,系统可不是一堆冷冰冰的代码。它就像一个活生生的“数字人”,没了它,业务根本转不起来。总说“技术要为业务服务”,但实际操作起来问题不少:系统怎么才能快速响应业务需求?...
- 谈谈分布式文件系统下的本地缓存_什么是分布式文件存储
-
在分布式文件系统中,为了提高系统的性能,常常会引入不同类型的缓存存储系统(算法优化所带来的的效果可能远远不如缓存带来的优化效果)。在软件中缓存存储系统一般可分为了两类:一、分布式缓存,例如:Memca...
- 进程间通信之信号量semaphore--linux内核剖析
-
什么是信号量信号量的使用主要是用来保护共享资源,使得资源在一个时刻只有一个进程(线程)所拥有。信号量的值为正的时候,说明它空闲。所测试的线程可以锁定而使用它。若为0,说明它被占用,测试的线程要进入睡眠...
- Qt编写推流程序/支持webrtc265/从此不用再转码/打开新世界的大门
-
一、前言在推流领域,尤其是监控行业,现在主流设备基本上都是265格式的视频流,想要在网页上直接显示监控流,之前的方案是,要么转成hls,要么魔改支持265格式的flv,要么265转成264,如果要追求...
- 30 分钟搞定 SpringBoot 视频推拉流!实战避坑指南
-
30分钟搞定SpringBoot视频推拉流!实战避坑指南在音视频开发领域,SpringBoot凭借其快速开发特性,成为很多开发者实现视频推拉流功能的首选框架。但实际开发中,从环境搭建到流处理优...
你 发表评论:
欢迎- 一周热门
- 最近发表
- 标签列表
-
- python计时 (73)
- python安装路径 (56)
- python类型转换 (93)
- python进度条 (67)
- python吧 (67)
- python的for循环 (65)
- python格式化字符串 (61)
- python静态方法 (57)
- python列表切片 (59)
- python面向对象编程 (60)
- python 代码加密 (65)
- python串口编程 (77)
- python封装 (57)
- python写入txt (66)
- python读取文件夹下所有文件 (59)
- python操作mysql数据库 (66)
- python获取列表的长度 (64)
- python接口 (63)
- python调用函数 (57)
- python多态 (60)
- python匿名函数 (59)
- python打印九九乘法表 (65)
- python赋值 (62)
- python异常 (69)
- python元祖 (57)