监控 – 第 7 页

建筑工地无线智能监控计划

要闻 • 2021年6月2日

1、建筑工地布线多有不便，进行基础网络架设比较困难； 2、工地上的钢筋、钢管、零星材料到处堆放，管理难度大； 3、工地进出人员复杂，小偷常来光顾，贵重施工机械被恶意破坏； 4、工人们不注意安全细节，稍不留神就可能受伤，各类事故频发； 5、担心发生

经验 • 2021年5月31日

异常检测在运维实践中有着举足轻重的地位，实时、准确的发现异常能够帮助我们及时采取行动，最大限度减少故障的损失。在监控领域中，其实最重要的一点是要能够通过一些监控指标发现问题，当我们的系统越来越大越来越复杂的时候，想从繁杂的指标当中，几百

经验 • 2021年5月31日

首先是游戏架构的变迁，从最开始的单机架构，扩展到分布式架构。也就是说，玩家看到一个游戏服，在后面会有十几台机器，有的甚至多达百台机器，取决于玩法不同。后来，很多游戏的开发接触到微服务的概念，开始逐渐的把游戏里面比如大厅、聊天服务从游戏的

经验 • 2021年5月31日

疑问：为什么需要对上报方案有要求呢？解读：比如腾讯内部的自研日志监控系统CMS，对拥有多种采集方案Agent、SDK、Kafka、ES等，各种不同的采集方案应对不同的场景 Agent：类似filebeat，指定服务器的具体路径，对文件的inode节点进行侦听，发现新增立即

经验 • 2021年5月30日

报警丰富：在报警处理过程中根据cmdb等配置信息库的管理信息，对原始报警的内容进行信息补充和完善的功能；报警维护期：应对日常变更、切换演练以及故障临时处置等场景下，提前屏蔽相关报警避免无效报警产生干扰；报警压缩：对于重复发生的报警信息，只

大数据 • 2021年5月30日

随着公司业务发展，大数据集群规模正在不断扩大，一些大型集群物理机节点甚至已近上千。面对如此规模庞大的集群，一套优秀的监控系统是运维人员发现及处理故障的关键利器。经过多次选型和迭代，笔者选择了Prometheus，这款时下火热而强大的开源监控组件为

教程 • 2021年5月29日

SLI，全名Service Level Indicator，是服务等级指标的简称，它是衡定系统稳定性的指标。 SLO，全名Sevice Level Objective，是服务等级目标的简称，也就是我们设定的稳定性目标，比如4个9，5个9等。 SRE通常通过这两个指标来衡量系统的稳定性，其主要思路

Linux • 2021年5月29日

dstat 是一款生成Linux系统资源统计信息的功能强大、灵活和通用的工具，可以替代vmstat，iostat，netstat和ifstat这些命令的多功能产品。dstat克服了这些命令的局限并增加了一些另外的功能，增加了监控项，也变得更灵活了。dstat可以很方便监控系统运行状

佳作 • 2021年5月28日

下面我们来分享下D监控的设置方法： 1、什么是宕机检测？宕机检测就是：当您的一个服务器确认宕机后，系统会自动给您切换到可用的服务器，宕掉的服务器恢复后自动切换回原ip（注意：系统不默认开启宕机检测，需要您手动启用宕机监控）检测的原理：我们会

经验 • 2021年5月28日

Falcon-agent是用Go语言开发的Daemon程序，运行在每台Linux服务器上，用于采集主机上的各种指标数据，主要包括CPU、内存、磁盘、文件系统、内核参数、Socket连接等，目前已经支持200多项监控指标。并且，Agent支持用户自定义的监控脚本。 Hearthbeat serve