市场上各类服务器监控工具各种各样,老牌的zabbix、新兴的Prometheus等、以及各类云厂商自研的各类监控。公司的几个工厂里有几台服务器,上面部署了虚拟化,然后会再部署供应商的各类生产系统;面对...
Continue reading...linux使用tc命令进行网络限速
公司有几个独立的工厂,一般每个工厂都会有自己本地的机房,用来部署本地的生产系统。这些系统都是独立运行,有自己的数据库、中间件、上层服务等,为了防止机房故障,会每天把重要数据备份下来,然后存到异地(比如...
Continue reading...Ubuntu离线更新或者安装软件包
在企业内部的机器中,为了业务和安全考虑,有一些服务器是禁止互联网的,但这些机器也有安装软件包、更新补丁的诉求。如何为不能联网的机器,安装软件呢?下面整理三种方法: 注三种方法,都必须额外有一台能上网的...
Continue reading...记一次React/Next.js组件RCE漏洞(CVE-2025-55182)导致服务器被植入挖矿程序排查
公司使用了国内的某公有云,在其中一台虚拟机上搭建了全套的dify大模型程序,因为有外部服务要调用,所以开了公网访问。近日收到监控报警,这台机器性能存在异常,也收到云厂商的提醒说可能存在安全问题。 先说...
Continue reading...QA越资深,越难发现简单bug?
在公司一直负责本部门的测试团队(偏车联网、后端方向),本部门的测试工作结束后,会再提供给整体的测试团队(整车方向);由整车QA进行实车测试,测试通过之后,进行整车发版。 最近发现一些现象,本部门的QA...
Continue reading...redis-cluster大规模集群架构
上篇文章说到最小资源下的redis主从高可用架构,但毕竟单台服务器的性能有限,随着业务的发展也会出现请求变慢的情况,这时就该对redis做拆分了,和数据库类似,有垂直拆分和水平拆分。 所谓垂直拆分,就...
Continue reading...redis主从结构最小高可用方案
redis是后端服务开发中常用中的缓存中间件,其以高性能、易用性而在互联网、金融等领域广泛使用。大流量业务可以使用redis多主多从集群模式,数据分片存储到不同节点上;小型服务可以使用redis的一主...
Continue reading...记一次Nginx进程挂掉的原因调查
本小站背后是某云的虚拟主机 + Nginx + WordPress,操作系统是Ubuntu Server。国庆假期之后上来访问发现web服务挂了,登录到服务器上发现是Nginx进程没了,国庆假期期间一...
Continue reading...postgresql监控pmm之部署问题解决
公司数字化部门为工厂产线采购了某MES生产系统,由公司IT提供硬件和基础操作系统,MES供应商负责系统建设和后续维护,但使用一段时间发现,无论是该MES系统自身的性能、还是供应商的运维能力,都有严重问...
Continue reading...mysql大表使用optimize优化碎片空间
mysql在互联网行业应用非常广泛,小到几个人的创业公司、大到一些巨头公司都在用。在运维mysql时,经常会遇到大表问题;当业务比较小的时候,一般采用一主一备+单表进行存储,随着业务发展,某些业务表中...
Continue reading...大模型编排平台dify初上手
AlphaGo赢了李世石,chatgpt惊艳了世人,L2级别自动驾驶已遍地跑,萝卜的L4已开始逐步落地,大模型也逐渐上车了。近几年大模型劲头十足,大有把一切推倒、再重塑的势头。随着全世界从移动互联网阶...
Continue reading...分布式网络延迟监控工具-smartping
上篇文章网络延迟监控-smokeping讲到smokeping这款网络延迟监控工具,开源且配置简单,适合用来监控各个节点到master的网络情况;但如果想监控各个节点之间的网络情况,有另外一款开源的工...
Continue reading...
近期评论