hello云胜

未命名

发表于 2026-02-11

一次堆外内存溢出故障

今天早上刚泡好茶，还没喝，业务的电话就打过来了。说给大领导的一个上传文件的服务不好用了，领导震怒，责令我们立即修复。

不等我开始排查，直属领导的电话也响起来了。很快领导自觉的站到我的身后，成为正宗的程序员鼓励师。

我们的这个文件服务也是坑，用户调用的接口和我们隔了两层。用户首先调用A网关提供的服务，A网关再转到B网关。B网关之后才到我们rest服务。这个rest接口实际又调了dubbo服务。

话不多说，立马打开postman测试一下。

A网关，哎，好使啊。

客户那边说了,小文件好使，你传个1M的就不行了。

好吧，换个大文件

A网关：失败。

B网关：哎，好使。

好了，我的排查结束了，因为网关不是我负责的。但是作为一个有追求的程序员，怎么会不帮忙看一下网关的问题呢。

找到日志，

很明确的netty报错，OutOfDirectMemoryError

还是领导高明，立即要求重启。问题得到修复。

现在来看，这个A网关产品是有bug的。因为第一现场已经没了，下面的排查命令只能是练手了，打印的信息已经不是出故障时的状态。

看一下这个进程的jvm配置

1 2	[root@APIGATEWAY01 bin]# ./jps -v 123725 core-1.0.0.RELEASE.jar -Xms8192m -Xmx16384m -XX:MaxDirectMemorySize=61440m

限制了最大堆外内存60G。（不要震惊，我们这台服务器内存是256G的，牛逼plus）

32C，256G就问你们怕不怕。题外话，继续。

1
2
3

# ps -p 123725 -o rss,vsz
  RSS    VSZ
2130228 36014336

rss是进程使用的内存，2G

vxz是进程的虚拟内存大小，36G

MAT

没有一个明显有问题的。

NMT

要监控jvm的堆外内存，首先要打开直接内存追踪参数。

在启动参数上加上-XX:NativeMemoryTracking=detail，之后重启。

然后用

1	jcmd pid VM.native_memory

未命名

发表于 2026-02-11

性能优化

http压测工具

ab 工具（通过 yum -y install httpd-tools 可以快速安装），对 http 请求接口进行测试

可以通过设置 -n 请求数 /-c 并发用户数来模拟线上的峰值请求，再通过 TPS、RT（每秒响应时间）以及每秒请求时间分布情况这三个指标来衡量接口的性能

未命名

发表于 2026-02-11

jstack检测cpu高

步骤一：查看cpu占用高进程

执行top命令后，按shift+p 按cpu使用量排序

top

Mem:  16333644k total,  9472968k used,  6860676k free,   165616k buffers
Swap:        0k total,        0k used,        0k free,  6665292k cached

  PID USER      PR  NI  VIRT  RES  SHR S %CPU %MEM    TIME+  COMMAND     
17850 root      20   0 7588m 112m  11m S 100.7  0.7  47:53.80 java       
 1552 root      20   0  121m  13m 8524 S  0.7  0.1  14:37.75 AliYunDun   
 3581 root      20   0 9750m 2.0g  13m S  0.7 12.9 298:30.20 java        
    1 root      20   0 19360 1612 1308 S  0.0  0.0   0:00.81 init        
    2 root      20   0     0    0    0 S  0.0  0.0   0:00.00 kthreadd    
    3 root      RT   0     0    0    0 S  0.0  0.0   0:00.14 migration/0

步骤二：查看cpu占用高线程

通过第一步得到了进程号

通过top -Hp 进程号，查看具体的线程情况

top -H -p 17850

top - 17:43:15 up 5 days,  7:31,  1 user,  load average: 0.99, 0.97, 0.91
Tasks:  32 total,   1 running,  31 sleeping,   0 stopped,   0 zombie
Cpu(s):  3.7%us,  8.9%sy,  0.0%ni, 87.4%id,  0.0%wa,  0.0%hi,  0.0%si,  0.0%st
Mem:  16333644k total,  9592504k used,  6741140k free,   165700k buffers
Swap:        0k total,        0k used,        0k free,  6781620k cached

  PID USER      PR  NI  VIRT  RES  SHR S %CPU %MEM    TIME+  COMMAND
17880 root      20   0 7588m 112m  11m R 99.9  0.7  50:47.43 java
17856 root      20   0 7588m 112m  11m S  0.3  0.7   0:02.08 java
17850 root      20   0 7588m 112m  11m S  0.0  0.7   0:00.00 java
17851 root      20   0 7588m 112m  11m S  0.0  0.7   0:00.23 java
17852 root      20   0 7588m 112m  11m S  0.0  0.7   0:02.09 java
17853 root      20   0 7588m 112m  11m S  0.0  0.7   0:02.12 java
17854 root      20   0 7588m 112m  11m S  0.0  0.7   0:02.07 java

步骤三：转换线程ID

通过第二步得到了线程17880有问题，转换成16进制，以便后续使用。

1 2	printf "%x\n" 17880 45d8

步骤四：定位cpu占用线程

在jstack打印的堆栈信息中查询线程相关信息

jstack 17850|grep 45d8 -A 30
"pool-1-thread-11" #20 prio=5 os_prio=0 tid=0x00007fc860352800 nid=0x45d8 runnable [0x00007fc8417d2000]
   java.lang.Thread.State: RUNNABLE
        at java.io.FileOutputStream.writeBytes(Native Method)
        at java.io.FileOutputStream.write(FileOutputStream.java:326)
        at java.io.BufferedOutputStream.flushBuffer(BufferedOutputStream.java:82)
        at java.io.BufferedOutputStream.flush(BufferedOutputStream.java:140)
        - locked <0x00000006c6c2e708> (a java.io.BufferedOutputStream)
        at java.io.PrintStream.write(PrintStream.java:482)
        - locked <0x00000006c6c10178> (a java.io.PrintStream)
        at sun.nio.cs.StreamEncoder.writeBytes(StreamEncoder.java:221)
        at sun.nio.cs.StreamEncoder.implFlushBuffer(StreamEncoder.java:291)
        at sun.nio.cs.StreamEncoder.flushBuffer(StreamEncoder.java:104)
        - locked <0x00000006c6c26620> (a java.io.OutputStreamWriter)
        at java.io.OutputStreamWriter.flushBuffer(OutputStreamWriter.java:185)
        at java.io.PrintStream.write(PrintStream.java:527)
        - eliminated <0x00000006c6c10178> (a java.io.PrintStream)
        at java.io.PrintStream.print(PrintStream.java:597)
        at java.io.PrintStream.println(PrintStream.java:736)
        - locked <0x00000006c6c10178> (a java.io.PrintStream)
        at com.demo.guava.HardTask.call(HardTask.java:18)
        at com.demo.guava.HardTask.call(HardTask.java:9)
        at java.util.concurrent.FutureTask.run(FutureTask.java:266)
        at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1142)
        at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:617)
        at java.lang.Thread.run(Thread.java:745)

"pool-1-thread-10" #19 prio=5 os_prio=0 tid=0x00007fc860345000 nid=0x45d7 waiting on condition [0x00007fc8418d3000]
   java.lang.Thread.State: WAITING (parking)
        at sun.misc.Unsafe.park(Native Method)
        - parking to wait for  <0x00000006c6c14178> (a java.util.concurrent.locks.AbstractQueuedSynchronizer$ConditionObject)
        at java.util.concurrent.locks.LockSupport.park(LockSupport.java:175)

未命名

发表于 2026-02-11

微服务架构浅显分享

概念

微服务

Martin Fowler

特别擅长抽象归纳和制造概念

Microservices (martinfowler.com)

微服务是由单一应用程序构成的小服务，拥有自己的进程与轻量化处理，服务依业务功能设计，以全自动的方式部署，与其他服务使用HTTP API通讯。同时，服务会使用最小规模的集中管理（例如Docker）技术，服务可以用不同的编程语言与数据库等。

单体应用

如果你不知道单体应用的痛，那也不会深刻理解微服务的价值。

早期的应用技术栈大致可分为LAMP（Linux + Apache + MySQL + PHP）和MVC（Spring + iBatis/Hibernate + Tomcat）两大流派。

无论是LAMP还是MVC，都是为单体应用架构设计的。

然而随着业务规模的不断扩大，代码和开发人员的增加，很快出现了一下几个问题：

部署效率低下
代码管理，代码冲突
系统高可用性差
线上发布慢

为了解决这些问题，服务化几乎就是自然而然产生的。

SOA

面向服务的体系结构 SOA (Service-Oriented Architecture) 听起来和微服务很像，但 SOA 早期均使用了总线模式，这种总线模式是与某种技术栈强绑定的，比如：J2EE。这导致很多企业的遗留系统很难对接，切换时间太长，成本太高，新系统稳定性的收敛也需要一些时间，最终 SOA 看起来很美，但却成为了企业级奢侈品，中小公司都望而生畏。

RPC

Remote Procedure Call，远程过程调用。

解决微服务的跨节点调用问题。

和restful调用的区别：

协议不同
调用方式不同。rpc的实现上经常使用本地代理，就像调用一个本地方法。

其实这两者并不是一个维度的概念，总得来说RPC涉及的维度更广。RPC可以基于HTTP协议实现，也可以直接在TCP协议上实现。

微服务框架

微服务架构下，服务调用主要依赖以下基本组件：

服务描述

常用的服务描述方式包括RESTful API、XML配置以及IDL文件三种。

restful的如springcloud，xml的如dubbo的xml文件，IDL文件方式通常用作Thrift和gRPC这类跨语言服务调用框架
注册中心

服务框架
服务监控
服务追踪
服务治理

Dubbo

阿里，最早只支持java。目前多语言支持。

默认通信协议是Dubbo Protocol，也支持其他的。

Tars

腾讯，最早只支持C++，目前支持C++,Java,PHP,Nodejs,Go语言。

通信协议是Tars protocol

Motan

新浪微博，java

gRPC

Google，跨语言。

gRPC 本身没有提供注册中心，但为开发者提供了实现注册中心的接口

thrift

Facebook，跨语言。

总结：

rpc框架并不神秘，简单来看就是解决如何调用远程服务的问题。所以通过注册中心进行服务的注册和发现。解决服务的负载均衡问题和状态监控。以及对象的序列化传输。但是要做一个高性能的，功能完善的rpc框架就难了。

RPC和微服务的关系

如上所述，远程过程调用。解决微服务的跨节点调用问题。

微服务框架一般都包含了RPC的实现和一系列「服务治理」能力，是一套软件开发框架。我们可以基于这个框架之上实现自己的微服务，方便的利用微服务框架提供的「服务治理」能力和RPC能力，所以微服务框架也被有些人称作RPC框架。

SpringCloud微服务框架

Spring Cloud全家桶，而Dubbo基本上只提供了最基础的RPC框架的功能，其他微服务组件都需要自己去实现。

注册中心

nacos

zookeeper，etcd，Eureka，Consul

负载均衡

客户端服务均衡

Ribbon –> Feign

全链路监控

skywalking，zipkin，pinpoint，jaeger, springcloud sleuth

Google Dapper：Dapper，大规模分布式系统的跟踪系统 by bigbully

监控

分布式事务

阿里开源的 seata

配置中心

Apollo

nacos

springcloud-config

服务网关

springcloud-gateway

服务限流、熔断、降级

推荐使用阿里开源的Sentinel

限流

应对突增流量，对超出自身处理能力的用户请求则予以拒绝，牺牲一部分用户体验，保证系统的稳定运行。

降级

降级就是通过停止系统中的某些非核心的功能，来保证系统高优先级服务的可用性。

熔断

服务熔断的作用类似于我们家用的保险丝，当某服务出现不可用或响应超时的情况时，为了防止整个系统出现雪崩，暂时停止对该服务的调用。

熔段解决如下几个问题：

当所依赖的对象不稳定时，能够起到快速失败的目的；
快速失败后，能够根据一定的算法动态试探所依赖对象是否恢复

断路器。Hystrix

熔断就是把客户端的每一次服务调用用断路器封装起来，通过断路器来监控每一次服务调用。如果某一段时间内，服务调用失败的次数达到一定阈值，那么断路器就会被触发，后续的服务调用就直接返回，也就不会再向服务提供者发起请求了。

Closed状态：正常情况下，断路器是处于关闭状态的，偶发的调用失败也不影响。
Open状态：当服务调用失败次数达到一定阈值时，断路器就会处于开启状态，后续的服务调用就直接返回，不会向服务提供者发起请求。
Half Open状态：当断路器开启后，每隔一段时间，会进入半打开状态，这时候会向服务提供者发起探测调用，以确定服务提供者是否恢复正常。如果调用成功了，断路器就关闭；如果没有成功，断路器就继续保持开启状态，并等待下一个周期重新进入半打开状态。

滑动窗口算法

Hystrix通过滑动窗口来对数据进行统计，默认情况下，滑动窗口包含10个桶，每个桶时间宽度为1秒，每个桶内记录了这1秒内所有服务调用中成功的、失败的、超时的以及被线程拒绝的次数。当新的1秒到来时，滑动窗口就会往前滑动，丢弃掉最旧的1个桶，把最新1个桶包含进来。

任意时刻，Hystrix都会取滑动窗口内所有服务调用的失败率作为断路器开关状态的判断依据，这10个桶内记录的所有失败的、超时的、被线程拒绝的调用次数之和除以总的调用次数就是滑动窗口内所有服务的调用的失败率。

微服务的容器化

我们现在在做的事

下一代微服务架构

传统的微服务框架的问题

服务消费者这边除了自身的业务逻辑实现外，还需要集成部分服务框架的逻辑，比如服务发现、负载均衡、熔断降级、封装调用等，而服务提供者这边除了实现服务的业务逻辑外，也要集成部分服务框架的逻辑，比如限流降级、服务注册等。

有人把kubernetes,service mesh和serveLess称为云原生架构的三驾马车

Service Mesh–服务网格

A service mesh is a dedicated infrastructure layer for handling service-to-service communication. It’s responsible for the reliable delivery of requests through the complex topology of services that comprise a modern, cloud native application. In practice, the service mesh is typically implemented as an array of lightweight network proxies that are deployed alongside application code, without the application needing to be aware.

和传统的微服务架构的本质区别

无代码侵入。Service Mesh以轻量级的网络代理的方式与应用的代码部署在一起，应用代码对此无感知。
完全的语言无关

第一代Service Mesh产品Linkerd

计算机领域有这么一句话：没有什么问题不是抽象出一层解决不了的。如果有，那就再抽象一层。

第一代Service Mesh产品Linkerd

2016年底概念提出，2017年重量级产品出现

SideCar & Control Plane

Service Mesh实现的关键就在于两点：一个是上面提到的轻量级的网络代理也叫SideCar，它的作用就是转发服务之间的调用；一个是基于SideCar的服务治理也被叫作Control Plane，它的作用是向SideCar发送各种指令，以完成各种服务治理功能。

sidecar

服务框架的功能都集中实现在SideCar里，服务消费者和服务提供者只管自己的业务实现。

control plane

Service Mesh的代表产品Istio

整体架构

Proxy，就是前面提到的SideCar。Istio的Proxy采用的是Envoy。Envoy是Istio中最基础的组件，所有其他组件的功能都是通过调用Envoy提供的API，在请求经过Envoy转发时，由Envoy执行相关的控制逻辑来实现的。

Pilot的作用是实现流量控制，它通过向Envoy下发各种指令来实现流量控制，服务发现和负载均衡。

Mixer的作用是实现策略控制和监控日志收集等功能。Istio支持两类的策略控制，一类是对服务的调用进行速率限制，一类是对服务的调用进行访问控制

Citadel的作用是保证服务之间访问的安全

未命名

发表于 2026-02-11

未命名

发表于 2026-02-11

异常体系

未命名

发表于 2026-02-11

List、List

一次堆外内存溢出故障

MAT

NMT

性能优化

http压测工具

jstack检测cpu高

步骤一：查看cpu占用高进程

步骤二：查看cpu占用高线程

步骤三：转换线程ID

步骤四：定位cpu占用线程

微服务架构浅显分享

概念

微服务

单体应用

SOA

RPC

微服务框架

Dubbo

Tars

Motan

gRPC

thrift

RPC和微服务的关系

SpringCloud微服务框架

注册中心

负载均衡

全链路监控

监控

分布式事务

配置中心

服务网关

服务限流、熔断、降级

限流

降级

熔断

微服务的容器化

下一代微服务架构

传统的微服务框架的问题

Service Mesh–服务网格

第一代Service Mesh产品Linkerd

第一代Service Mesh产品Linkerd

SideCar & Control Plane

sidecar

control plane

Service Mesh的代表产品Istio

整体架构

异常体系

<? extends T>与<? super T>

Stream全解析

Lambda表达式

语法

双冒号(::)操作符

与匿名类的区别

方法引用或函数接口

常用API

Collection接口的

静态方法

of

empty

contact

generate

iterate

实例方法

返回Stream的

peek

map

peek和map的区别

还有一个疑问

mapToInt

mapToLong

mapToDouble

limit

distinct

sorted

filter

终止方法

max

min

findFirst

findAny