LOGO designed by 熊大 .

   

:trollface: 哪吒监控 一站式轻监控轻运维系统。支持系统状态、HTTP(SSL 证书变更、即将到期、到期)、TCP、Ping 监控报警,命令批量执行和计划任务。

\>> QQ 交流群:872069346 **加群要求:已搭建好哪吒监控 & 有 2+ 服务器** \>> [我们的用户](https://www.google.com/search?q="powered+by+哪吒监控"&filter=0) (Google) | 默认主题 | DayNight [@JackieSung](https://github.com/JackieSung4ev) | hotaru | | ------------------------------------------------------- | -------------------------------------------------------- | ---------------------------------------------------------------------- | | ![首页截图1](https://s3.ax1x.com/2020/12/07/DvTCwD.jpg) | | | ## 安装脚本 **推荐配置:** 安装前准备 _两个域名_,一个可以 **接入 CDN** 作为 _公开访问_,比如 (status.nai.ba);另外一个解析到面板服务器作为 Agent 连接 Dashboard 使用,**不能接入 CDN** 直接暴露面板主机 IP,比如(randomdashboard.nai.ba)。 ```shell curl -L https://raw.githubusercontent.com/naiba/nezha/master/script/install.sh -o nezha.sh && chmod +x nezha.sh sudo ./nezha.sh ``` 国内镜像加速: ```shell curl -L https://cdn.jsdelivr.net/gh/naiba/nezha@master/script/install.sh -o nezha.sh && chmod +x nezha.sh CN=true sudo ./nezha.sh ``` _\* 使用 WatchTower 可以自动更新面板,Windows 终端可以使用 nssm 配置自启动(见尾部教程)_ ## 功能说明
计划任务:备份脚本、服务重启,等定期运维任务。 使用此功能可以定期结合 restic、rclone 给服务器备份,或者定期某项重启服务来重置网络连接。
报警通知:负载、CPU、内存、硬盘、带宽、流量、月流量、进程数、连接数实时监控。 #### 灵活通知方式 `#NEZHA#` 是面板消息占位符,面板触发通知时会自动替换占位符到实际消息 Body 内容是`JSON` 格式的:**当请求类型为 FORM 时**,值为 `key:value` 的形式,`value` 里面可放置占位符,通知时会自动替换。**当请求类型为 JSON 时** 只会简进行字符串替换后直接提交到`URL`。 URL 里面也可放置占位符,请求时会进行简单的字符串替换。 参考下方的示例,非常灵活。 1. 添加通知方式 - server 酱示例 - 名称:server 酱 - URL:https://sc.ftqq.com/SCUrandomkeys.send?text=#NEZHA# - 请求方式: GET - 请求类型: 默认 - Body: 空 - wxpusher 示例,需要关注你的应用 - 名称: wxpusher - URL:http://wxpusher.zjiecode.com/api/send/message - 请求方式: POST - 请求类型: JSON - Body: `{"appToken":"你的appToken","topicIds":[],"content":"#NEZHA#","contentType":"1","uids":["你的uid"]}` - telegram 示例 [@haitau](https://github.com/haitau) 贡献 - 名称:telegram 机器人消息通知 - URL:https://api.telegram.org/botXXXXXX/sendMessage?chat_id=YYYYYY&text=#NEZHA# - 请求方式: GET - 请求类型: 默认 - Body: 空 - URL 参数获取说明:botXXXXXX 中的 XXXXXX 是在 telegram 中关注官方 @Botfather ,输入/newbot ,创建新的机器人(bot)时,会提供的 token(在提示 Use this token to access the HTTP API:后面一行)这里 'bot' 三个字母不可少。创建 bot 后,需要先在 telegram 中与 BOT 进行对话(随便发个消息),然后才可用 API 发送消息。YYYYYY 是 telegram 用户的数字 ID。与机器人@userinfobot 对话可获得。 2. 添加一个离线报警 - 名称:离线通知 - 规则:`[{"Type":"offline","Duration":10}]` - 启用:√ 3. 添加一个监控 CPU 持续 10s 超过 50% **且** 内存持续 20s 占用低于 20% 的报警 - 名称:CPU+内存 - 规则:`[{"Type":"cpu","Min":0,"Max":50,"Duration":10},{"Type":"memory","Min":20,"Max":0,"Duration":20}]` - 启用:√ #### 报警规则说明 ##### 基本规则 - type - `cpu`、`memory`、`swap`、`disk` - `net_in_speed` 入站网速、`net_out_speed` 出站网速、`net_all_speed` 双向网速、`transfer_in` 入站流量、`transfer_out` 出站流量、`transfer_all` 双向流量 - `offline` 离线监控 - `load1`、`load5`、`load15` 负载 - `process_count` 进程数 _目前取线程数占用资源太多,暂时不支持_ - `tcp_conn_count`、`udp_conn_count` 连接数 - duration:持续秒数,秒数内采样记录 30% 以上触发阈值才会报警(防数据插针) - min/max - 流量、网速类数值 为字节(1KB=1024B,1MB = 1024\*1024B) - 内存、硬盘、CPU 为占用百分比 - 离线监控无需设置 - cover `[{"type":"offline","duration":10, "cover":0, "ignore":{"5": true}}]` - `0` 监控所有,通过 `ignore` 忽略特定服务器 - `1` 忽略所有,通过 `ignore` 监控特定服务器 - ignore: `{"1": true, "2":false}` 特定服务器,搭配 `cover` 使用 ##### 特殊:任意周期流量报警 可以用作月流量报警 - type - transfer_in_cycle 周期内的入站流量 - transfer_out_cycle 周期内的出站流量 - transfer_all_cycle 周期内双向流量和 - cycle_start 周期开始日期(可以是你机器计费周期的开始日期) - cycle_interval 小时(可以设为 1 月,30\*24) - min/max、cover、ignore 参考基本规则配置 - 示例: 3 号机器的每月 15 号计费的出站月流量 1T 报警 `[{"type":"transfer_out_cycle","max":1000000000000,"cycle_start":"2021-07-15T08:00:00Z","cycle_interval":720,"cover":1,"ignore":{"3":true}}]`
服务监控:HTTP、SSL证书、ping、TCP 端口等。 进入 `/monitor` 页面点击新建监控即可,表单下面有相关说明。
自定义代码:改LOGO、改色调、加统计代码等。 - 默认主题更改进度条颜色示例 ``` ``` - DayNight 主题更改进度条颜色示例(来自 [@hyt-allen-xu](https://github.com/hyt-allen-xu)) ``` ``` - 默认主题修改 LOGO、移除版权示例(来自 [@iLay1678](https://github.com/iLay1678)) ``` ``` - DayNight 移除版权示例(来自 [@hyt-allen-xu](https://github.com/hyt-allen-xu)) ``` ``` - hotaru 主题更改背景图片示例 ``` ```
## 常见问题
如何进行数据迁移、备份恢复? 数据储存在 `/opt/nezha` 文件夹中,迁移数据时打包这个文件夹,到新环境解压。然后执行一键脚本安装即可
如何禁用网络连接数监控? 编辑 `/etc/systemd/system/nezha-agent.service`,在 `ExecStart=` 这一行的末尾加上 `--skip-conn` 就是不监控连接数
Agent 不断重启/无法启动 ? 1. 直接执行 `/opt/nezha/agent/nezha-agent -s 面板IP或非CDN域名:面板RPC端口 -p Agent密钥 -d` 查看日志是否是 DNS 问题。 2. `nc -v 域名/IP 面板RPC端口` 或者 `telnet 域名/IP 面板RPC端口` 检验是否是网络问题,检查本机与面板服务器出入站防火墙,如果单机无法判断可借助 https://port.ping.pe/ 提供的端口检查工具进行检测。 3. 如果上面步骤检测正常,Agent 正常上线,尝试关闭 SELinux,[如何关闭 SELinux?](https://www.google.com/search?q=%E5%85%B3%E9%97%ADSELINUX)
如何使 OpenWrt/LEDE 自启动?来自 @艾斯德斯 首先在 release 下载对应的二进制解压 tar.gz 包后放置到 `/root`,然后 `chmod +x /root/nezha-agent` 赋予执行权限,然后创建 `/etc/init.d/nezha-service`: ``` #!/bin/sh /etc/rc.common START=99 USE_PROCD=1 start_service() { procd_open_instance procd_set_param command /root/nezha-agent -s 面板网址:接收端口 -p 唯一秘钥 -d procd_set_param respawn procd_close_instance } stop_service() { killall nezha-agent } restart() { stop sleep 2 start } ``` 赋予执行权限 `chmod +x /etc/init.d/nezha-service` 然后启动服务 `/etc/init.d/nezha-service enable && /etc/init.d/nezha-service start`
实时通道断开/终端连接失败 使用反向代理时需要针对 `/ws` 路径的 WebSocket 进行特别配置以支持实时更新服务器状态。 - Nginx(宝塔):在你的 nginx 配置文件中加入以下代码 ```nginx server{ #原有的一些配置 #server_name blablabla... location ~ ^/(ws|terminal/.+)$ { proxy_pass http://ip:站点访问端口; proxy_http_version 1.1; proxy_set_header Upgrade $http_upgrade; proxy_set_header Connection "Upgrade"; proxy_set_header Host $host; } #其他的 location blablabla... } ``` - CaddyServer v1(v2 无需特别配置) ```Caddyfile proxy /ws http://ip:8008 { websocket } proxy /terminal/* http://ip:8008 { websocket } ```
## 社区文章 - [哪吒探针 - Windows 客户端安装](https://nyko.me/2020/12/13/nezha-windows-client.html) - [哪吒监控,一个便携服务器状态监控面板搭建教程,不想拥有一个自己的探针吗?](https://haoduck.com/644.html) - [哪吒监控:小鸡们的最佳探针](https://www.zhujizixun.com/2843.html) _(已过时)_ - [>>更多教程](https://www.google.com/search?q="哪吒监控"+"教程") (Google)