Prometheus整合node_exporter实现主机监控

一、硬件规划

集群角色 ip 主机名
控制节点 192.168.64.101 bigdata01
工作节点 192.168.64.102 bigdata02
工作节点 192.168.64.103 bigdata03

软件版本:Cent OS 7.6

二、Prometheus部署

2.1 安装

# 解压
tar -zxvf prometheus-2.13.1.linux-amd64.tar.gz -C /usr/local/
# 创建软连接
mv /usr/local/prometheus-2.13.1.linux-amd64/ /usr/local/prometheus-2.13.1
ln -s /usr/local/prometheus-2.13.1/ /usr/local/prometheus
# 配置data文件夹
mkdir /usr/local/prometheus/data

2.2 添加系统服务

vi /usr/lib/systemd/system/prometheus.service

[Unit]
Description=https://prometheus.io
[Service]
Restart=on-failure
ExecStart=/usr/local/prometheus/prometheus --storage.tsdb.path=/usr/local/prometheus/data --config.file=/usr/local/prometheus/prometheus.yml
[Install]
WantedBy=multi-user.target

2.3 启动Prometheus服务

# 启动
systemctl start prometheus
# 查看状态
systemctl status prometheus

2.4 测试访问

http://ip:9000

image-20220224172006711

三、Prometheus配置文件介绍

  • global:此片段指定的是prometheus的全局配置,比如采集间隔、抓取超时时间。

  • rule_files:此判断指定报警规则文件,prometheus根据这些规则文件,会推送报警信息到alert Manager中。

  • scrape_configs:此片段指定抓取配置,prometheus的数据采集通过此片段配置。

  • alerting:此片段指定报警配置,这里主要是指定prometheus将报警规则推送到指定的alertManager实例地址。

  • remote_writer:指定后端的存储的写入地址

  • remote_reader:指定后端的存储的读取api地址。

Global配置参数

# How frequently to scrape targets by default. 抓取间隔
[ scrape_interval: <duration> | default = 1m ] 
# How long until a scrape request times out.抓取超时时间
[ scrape_timeout: <duration> | default = 10s ] 
# How frequently to evaluate rules.评估规则间隔
[ evaluation_interval: <duration> | default = 1m ]

scrapy_config片段的主要参数

一个scrape_config片段指定一组目标和参数,目标就是实例,指定采集的端点,参数描述如何采集这些实例,主要参数如下

scrape_interval: 抓取间隔,默认继承 global 值。 
scrape_timeout: 抓取超时时间,默认继承 global 值。 
metric_path: 抓取路径, 默认是/metrics 
*_sd_configs: 指定服务发现配置
static_configs: 静态指定服务 job。 
relabel_config: relabel 设置。

四、node-exporter安装和配置

4.1 node-exporter介绍

Node-exporter 可以采集机器(物理机、虚拟机、云主机)的监控指标数据,能够采集到的指标包括cpu、内存、磁盘、网络、文件数等信息。

4.2 node-exporter安装

# 解压
tar -zxvf node_exporter-0.18.1.linux-amd64.tar.gz -C /usr/local/
mv /usr/local/node_exporter-0.18.1.linux-amd64/ /usr/local/node_exporter-0.18.1
# 创建软连接
ln -s /usr/local/node_exporter-0.18.1/ /usr/local/node_exporter

4.3 添加到系统服务

vi /usr/lib/systemd/system/node_exporter.service

[Unit]
Description=Prometheus node_exporter
[Service]
User=nobody
ExecStart=/usr/local/node_exporter/node_exporter --log.level=error
ExecStop=/usr/bin/killall node_exporter
[Install]
WantedBy=default.target

4.4 启动node_exporter

# 启动
systemctl start node_exporter
# 查看服务状态
systemctl status node_exporter

image-20220224190424090

访问地址: http://ip:9100/metrics,可以看到监控的指标信息

4.5 配置Prometheus

在prometheus.yml中配置node_exporter的metrics端点,配置如下

global:
  scrape_interval: 5s
  evaluation_interval: 5s
  scrape_timeout: 5s

scrape_configs:
  - job_name: 'prometheus'
    static_configs:
    - targets: ['localhost:9090']
  - job_name: 'linux-exporter'
    metrics_path: /metrics
    static_configs:
    - targets: ['localhost:9100']

重启prometheus服务

systemctl restart prometheus

访问Prometheus Web UI地址 http://ip:9090/targets,可以看到新增了target为host_monitor的监测点。

image-20220224191845204

五、Grafana安装及配置

5.1 Grafana介绍

Grafana是一款用Go语言开发的开源数据可视化工具,可以做数据监控和数据统计,带有告警功能。目前使用grafana的公司有很多,如paypal、ebay、intel等。

5.2 安装

# 下载
wget https://dl.grafana.com/oss/release/grafana-8.3.2-1.x86_64.rpm
# 安装
yum install -y grafana-8.3.2-1.x86_64.rpm

5.3 启动

systemctl start grafana-server

5.4 Web UI

访问 http://ip:3000。默认用户名 密码 admin/admin,设置初始密码。

image-20220224193819531

选择添加Prometheus 数据源。

image-20220224193906578

添加配置prometheus,然后HTTP URL : http://ip:9090。下拉到最下面的,点击Save& Test

image-20220224194154232

5.5 添加DashBoard模板

Grafana 官方和社区对已经做好了常用的 DashBoard,可以访问 https://grafana.com/grafana/dashboards 进行查询,选择DashBoard

image-20220224200720820

通过Grafana + 图标导入(import)。输入Grafana id 为 8919

image-20220224194557817

注意选中prometheus数据源。

image-20220224194808754

5.6 可视化大屏

image-20220224200051270

参考文档

原文地址:https://www.cnblogs.com/shine-rainbow/p/15933389.html

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


这篇文章主要介绍“基于nodejs的ssh2怎么实现自动化部署”的相关知识,小编通过实际案例向大家展示操作过程,操作方法简单快捷,实用性强,希望这篇“基于nodejs...
本文小编为大家详细介绍“nodejs怎么实现目录不存在自动创建”,内容详细,步骤清晰,细节处理妥当,希望这篇“nodejs怎么实现目录不存在自动创建”文章能帮助大...
这篇“如何把nodejs数据传到前端”文章的知识点大部分人都不太理解,所以小编给大家总结了以下内容,内容详细,步骤清晰,具有一定的借鉴价值,希望大家阅读完这...
本文小编为大家详细介绍“nodejs如何实现定时删除文件”,内容详细,步骤清晰,细节处理妥当,希望这篇“nodejs如何实现定时删除文件”文章能帮助大家解决疑惑...
这篇文章主要讲解了“nodejs安装模块卡住不动怎么解决”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来...
今天小编给大家分享一下如何检测nodejs有没有安装成功的相关知识点,内容详细,逻辑清晰,相信大部分人都还太了解这方面的知识,所以分享这篇文...
本篇内容主要讲解“怎么安装Node.js的旧版本”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“怎...
这篇“node中的Express框架怎么安装使用”文章的知识点大部分人都不太理解,所以小编给大家总结了以下内容,内容详细,步骤清晰,具有一定的借鉴价值,希望大家...
这篇文章主要介绍“nodejs如何实现搜索引擎”的相关知识,小编通过实际案例向大家展示操作过程,操作方法简单快捷,实用性强,希望这篇“nodejs如何实现搜索引擎...
这篇文章主要介绍“nodejs中间层如何设置”的相关知识,小编通过实际案例向大家展示操作过程,操作方法简单快捷,实用性强,希望这篇“nodejs中间层如何设置”文...
这篇文章主要介绍“nodejs多线程怎么实现”,在日常操作中,相信很多人在nodejs多线程怎么实现问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法...
这篇文章主要讲解了“nodejs怎么分布式”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“nodejs怎么分布式”...
本篇内容介绍了“nodejs字符串怎么转换为数组”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情...
这篇文章主要介绍了nodejs如何运行在php服务器的相关知识,内容详细易懂,操作简单快捷,具有一定借鉴价值,相信大家阅读完这篇nodejs如何运行在php服务器文章都...
本篇内容主要讲解“nodejs单线程如何处理事件”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“nodejs单线程如何...
这篇文章主要介绍“nodejs怎么安装ws模块”,在日常操作中,相信很多人在nodejs怎么安装ws模块问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法...
本篇内容介绍了“怎么打包nodejs代码”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!
本文小编为大家详细介绍“nodejs接收到的汉字乱码怎么解决”,内容详细,步骤清晰,细节处理妥当,希望这篇“nodejs接收到的汉字乱码怎么解决”文章能帮助大家解...
这篇“nodejs怎么同步删除文件”文章的知识点大部分人都不太理解,所以小编给大家总结了以下内容,内容详细,步骤清晰,具有一定的借鉴价值,希望大家阅读完这篇...
今天小编给大家分享一下nodejs怎么设置淘宝镜像的相关知识点,内容详细,逻辑清晰,相信大部分人都还太了解这方面的知识,所以分享这篇文章给大家参考一下,希