量化交易系统开发实录(六):架构演进与重构决策
复盘 Micang Trader 的五次重构,解释系统如何从初始快照演进为更清晰的目标架构,并把技术债务和 ADR 决策纳入长期治理。
文章浏览
使用卡片、列表或紧凑模式浏览全站文章。视图偏好只保存在当前浏览器。
文章筛选
当前显示 72 / 72 篇文章
当前视图: 卡片
结果: 72 / 72
复盘 Micang Trader 的五次重构,解释系统如何从初始快照演进为更清晰的目标架构,并把技术债务和 ADR 决策纳入长期治理。
从一个跨夜交易日边界 bug 出发,重构量化交易系统的测试防线:缺陷导向测试金字塔、AI TDD 分工、边界时间、数据血缘和 CI Gate。
把性能优化从经验猜测改造成可验证的侦查流程:从 3 秒图表延迟出发,定位真实瓶颈,比较优化方案,建立 benchmark 与回退策略。
以交易日历与日线聚合需求为单一案例,解释 AI 工程化如何通过规格驱动、BMAD 角色交接和人工质量门禁进入真实量化系统交付。
继续把 Python 风险重组为参考篇:GUI 生命周期、异步网络失败、安全边界和部署基础设施如何影响量化交易系统的长期稳定性。
把 Python 陷阱从长清单重组为量化交易系统的工程风险参考篇:语法与作用域、类型与状态、并发与状态三类风险如何放大为真实交易系统问题。
以 Micang Trader 为案例,从系统边界、数据流、交易时段归属、回测实盘统一接口和 AI 协作边界出发,建立整个量化交易系统系列的架构主线。
基于 2015-2020 年企业级 CF 平台一线架构实践与 2015-2026(至今)行业观察,复盘 Cloud Foundry 时代的微服务治理设计决策,分析哪些经受住了时间考验,哪些被云原生浪潮重构
以 6 年企业级平台架构师实战经验,剖析可观测性在微服务治理中的核心地位,从数据孤岛到 OpenTelemetry 统一标准,构建精准决策的治理体系
回顾 Spring Cloud Gateway 在企业级 CF 平台的实践,剖析 Kubernetes Gateway API 的标准化价值,探索 Service Mesh 到 Ambient Mesh 的演进逻辑,为企业流量治理选型提供决策框架。
回顾 Hystrix 在微服务弹性治理中的历史地位,剖析 Resilience4j 的轻量设计哲学,探索自适应容错和混沌工程的新范式,为企业构建韧性系统提供实践指南。
回顾传统发布治理的人工审批模式,剖析蓝绿部署与金丝雀发布的演进,探索 GitOps 和渐进式交付的新范式,为企业构建高效安全的发布体系提供实践指南。
回顾 2015-2026(至今)微服务治理十余年演进脉络,提炼架构师的第一性原理,总结企业级治理的落地路径与常见陷阱,展望未来趋势,为技术决策者提供系统性思考框架。
删除大列表后内存为何不降?理解 Python Arena-Pool-Block 三层内存架构的工程权衡与设计逻辑
复盘Meta AI和DeepMind的真实生产困境,解析PEP 703的偏向引用计数(BRC)技术,探讨Python 3.13+ nogil构建对大模型并发的意义
综合 ctypes、CFFI、PyBind11、Cython、PyO3/Rust 五种绑定路线,探讨 Python 作为大模型胶水语言的技术本质与工程选择
解析 Python 类型注解、异步 I/O、FastAPI 的崛起逻辑,建立大模型 API 服务开发的特征-能力匹配框架
基于 Stack Overflow 2025 数据,建立从入门到专家的能力建设路线图,提供阶段判断、优先级排序与最小可执行方案
理解 JMM、volatile、final 字段、安全发布、乐观锁、锁语义和现代 ConcurrentHashMap 的工程边界。
以生产症状、GC logs、JFR、容器内存和回滚策略为主线,建立 G1、ZGC、Shenandoah、Parallel、Serial 的证据化选型与调优方法。
从吞吐、阻塞、资源池、下游保护、pinning、结构化并发、可观测性与迁移边界理解 Loom 的生产治理方法。
区分已交付的 FFM API、仍在演进的 Valhalla 值类型与泛型专门化,并从对象布局、内存局部性、native interop、安全边界和迁移治理视角建立生产判断。
从 JVM 容器资源、镜像策略、Kubernetes 运行边界、Native Image、Serverless、供应链安全到故障诊断,建立 Java 云原生生产判断路径。
区分 Spring AI 官方 API、LangChain4j 抽象、示例封装和企业级 AI 运行治理。
面向 HotSpot、Graal、Native Image 与 PGO 的性能诊断和决策路径。
以企业架构视角判断 Java 未来十年的版本策略、路线图状态、生态边界、云原生、AI 与性能演进。
拆解引用计数、gc.collect()、del 语句三大误区,建立 Python GC 机制(引用计数+分代GC+循环检测)的完整认知框架
综合 Stack Overflow 2025、PEP 703 行业证言、LangChain 生态等多源数据,分析 Python 在 AI 领域统治地位的成因与飞轮效应
本页为 Python 内存模型深度解析系列导航页,按阅读顺序提供全量入口,建立从底层机制到工程实践到职业发展的完整认知体系。
当AI编程助手成为标配,真正的竞争力不再是会不会使用AI,而是能不能判断、校准和约束AI的工程输出。本文从信任缺口、反馈协议、评估标准和能力闭环出发,建立“人类作为Coding Mentor”的核心框架。
公开基准不是模型排行榜的装饰,而是理解AI编程能力边界的测量工具。本文从HumanEval、APPS、CodeContests、SWE-bench、LiveCodeBench和Aider等基准出发,说明如何读榜、如何选择基准,以及如何把公开评估转化为团队自己的Coding Mentor评估体系。
高质量编程题不是更长的 prompt,而是能稳定暴露能力边界的评估契约。本文从 Bloom 层级、难度校准、任务契约、测试设计和题库治理出发,说明如何为 AI Coding Mentor 构建可复现的题目体系。
给AI当Coding Mentor不是做一次模型测评,而是建立一套能持续暴露能力边界、记录失败证据、驱动专项改进和支撑协作决策的评估运营系统。
给AI当Coding Mentor的核心技能不是写更长的提示词,而是设计任务协议、控制对话节奏、识别错误模式,并把协作过程沉淀为可验证、可复用的反馈信号。
案例研究不应该停留在“如何更会用AI工具”。本文用模型选型评估、反馈协议设计、代码审查信号沉淀和编程教育数据闭环四个工程场景,说明人类如何把AI协作过程转化为可评估、可训练、可复用的导师信号。
AI编程助手真正的组织价值,不只是提高交付速度,而是在每一次需求拆解、代码生成、评审修正、测试验证和上线复盘中沉淀可训练、可评估、可复用的导师信号。本文重构AI训练、AI辅助产品工程化交付、高质量SFT数据沉淀与模型评估的闭环框架。
承接第7篇的数据闭环,本文聚焦如何将已筛选的工程资产加工为高质量SFT样本,并接入可治理、可评估、可迭代的训练流水线。
作为系列收官篇,本文以工程决策视角重构 AI Coding Mentor 的未来路线:评估对象如何演进、组织能力如何分层、治理边界如何前置。
当你的博客文章超过20篇,读者开始迷失在时间里。这篇文章分享一个实战经验:为什么专题化是博客升级的第一步,以及如何判断你是否已经到了需要升级的时刻。
在 agentic coding eval 里,模型并不是唯一变量。资源 headroom、kill 语义、并发压力、网络状态和 sandbox 行为都会改变任务结果。如果这些条件不透明,排行榜上的小分差往往没有看起来那么能说明问题。本文基于 Anthropic 对 infrastructure noise 的分析,延展出我对 agent benchmark 可解释性、披露纪律、重复实验与系统级评测观的完整理解。
真正决定 agent 上限的,往往不是模型本身,而是围绕模型组织起来的 harness。本文基于 LangChain 对 agent harness 的拆解,延展出我对文件系统、代码执行、上下文管理、验证闭环与长时任务续航能力的完整理解,也解释了为什么 2026 年 AI 工程竞争的重心,正在从'模型能力'转向'工作系统设计'。
Colab MCP 的价值不只在于把 Python 跑到云上,而在于它让 agent 的执行环境变成了可见、可编辑、可继续工作的 notebook 空间。对很多任务来说,真正重要的不是远程执行本身,而是远程工件如何支持人机协作。本文基于 Google 对 Colab MCP Server 的介绍,延展出我对 runtime surface、artifact-centered design、远程工作台与可见性信任机制的完整理解。
MCP 的真正意义,不只是统一工具接入,而是把大量本该由运行时处理的中间流程,从昂贵的 LLM 循环里迁出去。它改变的不是'能接多少工具',而是 agent 如何使用上下文、代码执行和运行时控制流。本文基于 Anthropic 对 code execution with MCP 的讨论,延展出我对 direct tool-calling、progressive disclosure、runtime economics 和 executable skills 的完整理解。
如果一个 eval harness 只能告诉你任务成败,却解释不了 agent 是否调用了正确能力、在什么环境里执行、为什么失败、为什么成功,那它给出的就不是系统性判断,只是一块分数牌。本文基于 LangChain 对 skills eval 的讨论,延展出我对 artifact-based scoring、invocation metrics、trace design、workflow eval 与评测组织学的完整理解。
长时任务 agent 的失败,往往并不源于模型不会思考,而源于系统没有把'交接、恢复、验证、续跑'设计成一等公民。本文基于 Anthropic 对 long-running agent harness 的讨论,延展出我对跨会话执行、状态外化、feature contract、smoke test、browser verification 和多轮执行结构的完整看法,也解释了为什么真正可用的 agent,不是一次跑很久,而是一轮一轮接得住。
本页为 OpenClaw 深度解读系列导航页,按阅读顺序提供全量入口。
为什么OpenClaw安全事故总在'已经知道有风险'之后才发生?本文不归咎于模型失控,而是追问执行权设计缺陷:当系统把执行权、审计权和回滚权压在同一条链路,组织性失明如何把可控偏差一步步放大成事故。
这不是一篇赞美'轻量化'的鸡汤文,而是一篇反对工程幻觉的文章:很多看起来更强的OpenClaw Agent栈,只是把复杂性前置成了演示能力,却把代价后置成了生产故障和凌晨值班成本。
这篇文章不讨论控制台界面好不好看,而是讨论更根本的生产问题:当你把18个OpenClaw Agent接进Notion控制平面时,系统到底是在放大团队生产力,还是在放大调度噪声和状态混乱?
这篇文章不把ESP32边缘Agent写成酷炫技术试玩,而是拆掉四个最常见的误区:板子能跑不等于系统可用,离线不只是网络问题,本地成功也不等于现场可维护。边缘部署需要新的工程假设。
OpenClaw API控费如果只盯模型单价,最后通常会变成一种廉价的幻觉:账面短期好看了,但结构性浪费依旧在后台悄悄累积。本文重建一个包含预算边界、任务分层与入口路由的成本框架。
把'Agent知道了你的密码'重写成一次更不舒服的事故复盘:真正失效的不是某个加密动作,而是团队把凭据当成持续在线、持续可见、持续可调用的默认能力。本文讨论运行时治理缺口。
很多团队把OpenClaw安全寄托在prompt约束上,但真正决定事故上限的不是模型怎么想,而是系统是否允许模型的想法直接变成工具执行。本文提出'意图—裁决—执行—审计'四层治理框架。
拆掉一个很常见但很危险的错觉:当团队说'我们已经用Terraform加固过了',他们往往只是完成了起点,却误以为自己已经站在终点。IaC能让部署一致,却不能自动让OpenClaw系统持续安全。
反驳一种太常见的错觉:只要密钥托管、加密存储和轮换都做了,OpenClaw凭据安全就算完成。现实恰恰相反,最容易出事的地方往往发生在运行时——不是'放哪里',而是'谁在什么时候能动它'。
当提示词注入、凭据外泄和工具防火墙三个话题被放在同一张桌子上,你会发现它们指向同一个核心矛盾:OpenClaw的能力扩张快过了执行权治理。本文综合三篇安全文章的共同结论。
专题和标签有什么区别?为什么标签多了反而更难找内容?这篇文章拆解内容分类学中最常见的三个误区,并分享一个实用的'三层标签体系'设计方法。
专题化解决了内容归属,但读者打开首页时应该看到什么?这篇文章分享如何设计一个'内容发现型'首页,而不是简单的时间流列表。
把前三篇文章的设计理念转化为代码。这篇是完整的技术实现指南,包含项目结构、Schema 设计、动态路由、搜索集成等全部代码。
深入探索大语言模型微调的完整实践路径,从数据准备的工程思维到模型训练的细节把控,揭示让通用AI变身领域专家的关键方法论
深入探索LLM数据准备的工程方法论,从IBM Data Prep Kit工具解析到企业级数据流水线构建,揭示高质量训练数据背后的系统化工程实践
深入剖析Agent质量评估的本质挑战,以及为什么质量工程是决定AI产品成败的关键
深入解析 Agent 的五个层级、核心架构与生产实践,梳理 Kaggle 白皮书《Introduction to Agents》的关键框架与启发
深入剖析Model Context Protocol协议设计的本质,以及为什么标准化是Agent生态繁荣的关键
深入剖析Agent记忆系统的本质挑战,以及为什么上下文管理是决定AI产品成败的关键
深入剖析Agent生产化的核心挑战,探讨如何将Agent原型转化为可信赖的生产级系统
深入剖析Agent与传统软件的根本差异,以及为什么传统监控方法在AI时代失效
基于Node.js项目脚手架的AI测试Agent实践分析,探讨自动化质量门禁的实现思路
基于多Agent系统实践经验的失败模式分析,结合科幻文学的预见性思考
基于生产环境RAG系统故障案例的深度分析,探讨静默幻觉问题的本质、监控盲区以及架构层面的解决方案
探索AI编码Agent对工程、产品、设计角色的深远影响,以及团队组织方式的根本变革
原创技术解读与精选国外技术社区文章,探索AI工程化最佳实践