system-design-101读书笔记
System-101 的读书笔记
Communication Protocols (API)
API design (RestAPI vs. GraphQL)
gRPC 是什么
Step 1: A REST call is made from the client. The request body is usually in JSON format.
client 请求
Steps 2 - 4: The order service (gRPC client) receives the REST call, transforms it, and makes an RPC call to the payment service. gRPC encodes the client stub into a binary format and sends it to the low-level transport layer.
"client stub" 是客户端用来透明地与远端 gRPC 服务进行通信的本地代表。它隐藏了网络通信的复杂性,让远程服务调用看起来像是本地方法调用一样简单。
Step 5: gRPC sends the packets over the network via HTTP2. Because of binary encoding and network optimizations, gRPC is said to be 5X faster than JSON.
为什么要用 gRPC
Steps 6 - 8: The payment service (gRPC server) receives the packets from the network, decodes them, and invokes the server application.
Steps 9 - 11: The result is returned from the server application, and gets encoded and sent to the transport layer.
Steps 12 - 14: The order service receives the packets, decodes them, and sends the result to the client application.
Webhook 是什么
假设我们有个 eCommerce Web, 我们要完成一次交易, 需要向 payment service provider(PSP) 请求.
- short polling(短轮巡)
short polling 的两个缺点
- 要不断的向 payment service 请求
- 外部直接访问交易服务, 不安全
- Webhook
We can register a webhook with the external service. It means: call me back at a certain URL when you have updates on the request. When the PSP has completed the processing, it will invoke the HTTP request to update the payment status.
What if the PSP never calls back? We can set up a housekeeping job to check payment status every hour.
webhook 又被称为reverse APIs, 使用 webhook 需要注意的三件事情
- design proper API
- API gateway for security
- register the correct URL at the external service
提高 API performance
Pagination
分页, 从数据库或服务请求大量结果时,为了提高服务的响应性,不是一次性将所有结果发送给客户端,而是将结果分批次逐渐地发送给客户端。
shopee 的店家页面, 货品信息的 api 全部是按照页面设计
异步日志 (Asynchronous Logging)
异步日志记录则采用了不同的策略。当应用程序产生日志时,它首先将日志信息发送到一个内存中的缓冲区,通常是一个无锁的队列。这个操作相比磁盘 I/O 要快得多,因此应用程序几乎可以立即返回继续执行。然后,一个单独的后台进程或线程会负责定期地将缓冲区中的日志数据批量写入磁盘。这种方法大大减少了 I/O 开销,因为它减少了磁盘操作的次数,并且可以利用批处理和其他优化技术来提高效率。
缓存 (Caching)
Redis
Payload Compression
负载压缩:
使用如 gzip、Brotli、Deflate 等压缩算法对文本数据压缩
Connection Pool
链接池
HTTP 1.0 -> HTTP 1.1 -> HTTP 2.0 -> HTTP 3.0 (QUIC)
- HTTP 1.0: 1996. 每一个对于服务器的访问需要一个单独的 TCP Connection
- HTTP 1.1: 引入 持久链接 (keep-alive),这意味着在同一个 TCP 连接上可以发送和接收多个 HTTP 请求和响应,而不需要每次交换数据时都打开一个新的连接. 但是仍然没有解决 HOL (head of line 头部阻塞) 的问题 (意思就是在一个 TCP 连接中,所有的 HTTP 请求和响应都是按顺序进行的。这意味着第一个请求必须完成(包括发送请求和接收响应),第二个请求才能开始。)
- HTTP 2.0: 2015. 允许一个 TCP connections 上复用 (multiplexing) 但是仍然存在 TCP 层面上的头部阻塞问题
- HTTP 3.0: 2020(first draft) 使用 QUIC 来替代 TCP.
QUIC(Quick UDP Internet Connections)是一种基于 UDP(User Datagram Protocol)的传输协议,它在传输层引入了流(streams)的概念。在 QUIC 协议中,流被视为一等公民,这意味着它们是协议设计的核心部分,而不是像 HTTP/2 中那样在应用层上实现的抽象概念。
SOAP vs REST vs GraphQL vs RPC
Code First vs. API First
can have TDD when using API first development.
HTTP Status codes
补充一个 418 - I'm a teapot. 之前在用友实习的时候有这个返回码笑死.
What does API gateway do?
之前看过部分 Treafik 的东西,最后没有上手用有点可惜了.