zezepath
本站致力于IT相关技术的分享
基于服务发现事件流与ClickHouse构建动态服务拓扑的可观测性实践 基于服务发现事件流与ClickHouse构建动态服务拓扑的可观测性实践
在数百个微服务频繁变更、弹性伸缩的环境中,依赖一份静态的、人工维护的CMDB或架构图来理解服务间的依赖关系,无异于刻舟求剑。当故障发生时,最关键的问题往往是:“谁调用了这个服务?”、“这个服务最近的下游变更是什么?”、“哪些新实例刚刚上线?
2023-10-27
在服务网格中为容器化Django应用实现基于eBPF的零侵入L7遥测 在服务网格中为容器化Django应用实现基于eBPF的零侵入L7遥测
项目中的一个核心Django API服务,在迁移到服务网格后,P99延迟出现了无法容忍的抖动。问题根源很明确:服务网格的Sidecar代理,虽然提供了丰富的流量治理和可观测性能力,但其带来的额外网络跳数和资源开销,对于这个对延迟极度敏感的服
2023-10-27
构建基于 OpenTelemetry 与 Pandas 的 AWS SNS 死信队列可观测性分析管道 构建基于 OpenTelemetry 与 Pandas 的 AWS SNS 死信队列可观测性分析管道
消息处理失败是分布式系统中不可避免的现实。一个常见的处理模式是使用死信队列 (Dead Letter Queue, DLQ) 来捕获这些无法被成功消费的消息,防止它们阻塞主队列并为后续的排查和重试提供机会。但在一个复杂的系统中,DLQ 中的
2023-10-27
基于 Tekton 和 DVC 为 Express.js 模型服务实现数据驱动的 Docker Swarm 部署 基于 Tekton 和 DVC 为 Express.js 模型服务实现数据驱动的 Docker Swarm 部署
模型部署的追踪性混乱是我们团队在生产环境中遇到的一个棘手问题。开发人员更新服务代码,算法工程师则迭代模型文件。最初,我们依赖手动流程:算法同学在共享存储上放置一个新模型,然后在配置文件中手动更新路径,最后触发一次代码发布。这套流程很快就暴露
2023-10-27
构建基于CircleCI与Playwright的Saga模式自动化韧性测试管道 构建基于CircleCI与Playwright的Saga模式自动化韧性测试管道
一个跨多个微服务的订单处理流程必须保证数据一致性。当支付服务成功扣款,但库存服务因网络抖动而更新失败时,系统绝不能陷入一个“钱已付、货未扣”的中间状态。这是一个典型的分布式事务场景,也是无数系统稳定性的试金石。 定义挑战:云原生环境下的事务
在 GKE 中为 ArangoDB 和 NATS JetStream 构建可隔离的事务性集成测试环境 在 GKE 中为 ArangoDB 和 NATS JetStream 构建可隔离的事务性集成测试环境
我们面临一个典型的事件驱动架构难题。一个部署在 GKE 上的微服务需要消费 NATS JetStream 的消息,然后对 ArangoDB 中的图数据执行一个复杂的多文档事务操作。业务逻辑本身并不晦涩:当一个USER_CONNECTED事件
2023-10-27
4 / 5