Lumirain
BlogAboutContact Me

© 2026 Lumirain

蜀ICP备2025155035号-2
GitHubTwitter

Writing

Thoughts on software engineering, AI, and the craft of building.

AIInfrastructureComputeAMDSovereign AI

主权 AI 的重心,正在从模型口号回到硬件栈

英国和 AMD 在同一天把 AI 叙事拉回芯片、超算和人才。我越来越觉得,AI 竞争的下一层不是谁会喊 AGI,而是谁能把算力供应链做成可运营的系统。

June 8, 2026·1 min read
AIAgentInfrastructureRuntimeCloud

Agentic Infra 之后,我更相信 Agent 竞争会落到运行时

华为云今天发布 Agentic Infra 和 AgentSphere,让我更确定 agent 竞争的重心正在从模型调用转向生产级运行时、sandbox、调度和观测。

June 8, 2026·2 min read

Local Multimodal Layer: Gemma 4 12B 让我重新看个人设备代理

我把 Gemma 4 12B 看成一个信号:多模态代理正在从云端演示走向个人设备常驻,本机开始承担低延迟、隐私敏感、强上下文的第一层执行。

June 4, 2026·2 min read

Agentic Attack Chain: Anthropic MITRE 报告让我重新看 AI 安全

Anthropic 用一年被封禁的 AI-enabled cyber threat 样本映射 MITRE ATT&CK,最值得警觉的不是模型会写 payload,而是攻击者开始把 AI 接进完整攻击链。

June 3, 2026·2 min read

Bedrock Control Plane: Codex GA 让我重新看企业代理入口

OpenAI models 和 Codex 在 Amazon Bedrock 上 GA,不只是多了一个云分发渠道,而是 coding agent 开始进入企业身份、权限、审计、区域和成本控制面。

June 2, 2026·3 min read

Persistent Agent Layer: Gemini Spark 让我重新看后台代理

我把 Gemini Spark 看成一个信号:AI 正在从前台问答进入后台托管,真正的竞争会落到权限、日志、调度和可中断执行。

May 31, 2026·1 min read

Endpoint Host Layer: Codex Windows 让我重新看代理工作站

OpenAI 5 月 29 日把 Codex Computer Use 和远程控制扩到 Windows,我更在意的是:开发者工作站正在变成可远程批准、可审计、可恢复的代理运行时。

May 30, 2026·2 min read

Governance Interface:OpenAI 和 Anthropic 把 AI 治理推到了交付层

OpenAI 发布 Frontier Governance Framework,Anthropic 同日宣布新融资和算力扩张。我更关心的不是估值,而是治理正在变成开发者要交付的接口。

May 29, 2026·1 min read

Agent Improvement Loop: CoreWeave 让我重新看生产反馈

CoreWeave 2026-05-28 的 agentic AI 闭环发布提醒我:AI 应用的下一层竞争,是能否把生产失败样本持续变成代理改进燃料。

May 28, 2026·1 min read

AI Context Governance Layer: Copilot 让我重新看上下文治理

GitHub Copilot 在 2026-05-26 同时更新 Memory 控制和组织级模型规则,这不是普通功能迭代,而是代理记忆、模型选择和企业上下文治理控制面开始合流。

May 27, 2026·1 min read

Patch Throughput Layer: Glasswing 让我重新看安全修补队列

Project Glasswing 把 AI 安全的瓶颈从发现漏洞推到验证、披露和修补吞吐;我更关心团队怎样重写自己的 patch queue。

May 26, 2026·1 min read

AI Revocation Window:Gemini API Key 让我重写事故响应

我从 Google API key 删除后仍可用的近 24 小时讨论里,重新审视 AI 应用的凭证撤销、agent 熔断和事故响应边界。

May 25, 2026·2 min read

Provenance Layer: OpenAI 验图工具让我重新看内容可信度

我把 OpenAI 的图像验证工具看成一个信号:AI 产品竞争正在从生成能力,继续下沉到内容来源可读性和可信运行层。

May 24, 2026·1 min read

Execution Layer 2026: Microsoft EY 让我重新看 AI 落地

近 24 小时的 Microsoft/EY 官方信号让我更确信:企业 AI 正从模型能力竞争转向可重复执行的组织能力。

May 22, 2026·1 min read

Model Router Layer: Copilot Auto 让我重新理解模型选择

GitHub 5 月 20 日的 Copilot Auto、Web 模型收敛和报表域名更新,说明模型选择正在从手工 picker 变成可治理的路由层。

May 21, 2026·2 min read

Agent Harness Layer: Google Antigravity 把代理运行时推到 API 层

Google I/O 2026 里我最在意的不是模型名,而是 Antigravity 和 Managed Agents 把 agent harness 变成可调用、可恢复、可治理的基础设施。

May 20, 2026·1 min read

AI Delivery Rail: KPMG Claude 与 Stainless 让我重新看企业 Agent 落地

我今天看到的重点不是模型发布,而是 Anthropic 把企业现场和工具连接层同时铺起来,Agent 竞争正在进入交付轨道层。

May 19, 2026·2 min read
AIGitHub CopilotCodexAgentDeveloper

AI Model Supply Contract: Copilot 默认模型权比新模型发布更重要

GitHub 把 GPT-5.3-Codex 设为 Copilot Business 和 Enterprise 默认模型后,我更确定:AI 编程正在从模型能力竞争进入模型供应合同竞争。

May 18, 2026·2 min read
AIOpenAIDeveloper

AI Public Capacity:马耳他把 ChatGPT Plus 发给全民之后,开发者要看见什么

我对近 24 小时 AI 热点的判断:国家级 ChatGPT Plus 分发不是订阅补贴,而是 AI 从个人工具走向公共能力入口的信号。

May 17, 2026·1 min read

AI Integration Contract Layer: OpenAI 与 Apple 的裂缝给开发者的提醒

OpenAI 与 Apple 的合作裂缝提醒我,AI 时代真正稀缺的不是入口,而是能把模型能力放进任务现场的集成合同层。

May 16, 2026·1 min read

AI Runtime Governance Layer: Codex Mobile and the TanStack Lesson

我用 OpenAI 过去 24 小时里的 Codex mobile 和 TanStack 供应链响应,重新判断 AI agent 的下一层竞争:运行时治理。

May 15, 2026·1 min read

smb-workflow-layer:Claude for Small Business 和小企业的 AI 流水线

Claude for Small Business 把 AI 从聊天窗口推进到小企业的账务、销售、合同和营销流水线里;我更关心的不是谁短期领先,而是谁能沉淀真实业务 workflow。

May 14, 2026·1 min read

Agentic OS Layer 2026:Gemini Intelligence 把手机变成代理底座

我把 Google 这轮 Android Show 看成一个系统层信号:AI agent 正在从聊天框进入操作系统,开发者要开始为 agent-addressable 软件设计接口。

May 13, 2026·2 min read

Cyber Trusted Access Layer 2026:Daybreak 让我重新理解安全代理

Daybreak 最值得看的不是一个更强的安全模型,而是强 cyber 能力开始被访问合同、审计证据和 Codex 工作流托管。

May 12, 2026·2 min read

DeployCo Layer 2026:OpenAI 把模型公司变成实施公司

OpenAI 推出 Deployment Company 后,我更确信 AI 竞争正在从模型发布转向现场交付:稀缺的不再是 API,而是能把智能嵌进真实组织的人。

May 11, 2026·2 min read
AIAgentCodexGovernanceDeveloper

Agent Governance Layer:Codex 安全运行和企业控制塔的 24 小时信号

我从 OpenAI Codex 安全运行、ServiceNow AI Control Tower、Google AI control center 和 Microsoft Agent 365 里看到的信号:agent 竞争正在转向治理层。

May 10, 2026·2 min read

Personal Agent Replay Layer 2026:Gemini Remy 让我更在意代理回放层

我对近 24 小时 Gemini Remy 报道的判断:个人 AI 代理真正要竞争的不是更主动,而是可回放、可修改、可撤销。

May 9, 2026·2 min read

Agent Control Plane 2026:代码代理开始接管生产节奏

我把 Anthropic 近 24 小时的 Claude Code、Managed Agents 和 Microsoft 365 更新放在一起看,结论是代码代理正在从工具变成生产控制面。

May 8, 2026·2 min read

企业 AI 的下一道门槛不是模型,而是治理化落地

OpenAI 5 月 6 日的 B2B Signals 和 Enterprise 更新显示,AI 竞争正在从模型能力转向可治理的企业落地能力。

May 7, 2026·1 min read
AIAGIAnthropicSpaceXAIAgentDeveloper

递归研发仪表盘:Anthropic、SpaceXAI 与开发者的新告警系统

我把过去 24 小时的两个 AI 信号连在一起看:Anthropic 开始公开讨论 AI-driven AI R&D 的 telemetry,SpaceXAI 开始把 Colossus 算力租给 Anthropic,开发者该补的是递归研发仪表盘。

May 7, 2026·1 min read
AIAGIOpenAIAnthropicAgentDeveloper

AGI 反脆弱层竞争:OpenAI、Anthropic 与开发者的现实建模能力

我对 AGI 新趋势的判断:上游训练通用智能,下游开发者训练现实可读性,竞争核心已转向反脆弱执行系统。

May 5, 2026·1 min read
AIAGIAgentOpenAIAnthropicDeveloper

AGI 进入“委托链路层竞争”:OpenAI、Anthropic 与开发者的执行代理人时代

我把最近 AGI 热点收敛成一个判断:上游在竞争可托付的委托链路,下游开发者将升级为执行系统与委托链路设计师。

May 4, 2026·1 min read
AIAGIOpenAIAnthropicDeveloperFutureAgentSystemsMemoryArchitectureEngineering

AGI 进入“组织记忆层竞争”:OpenAI、Anthropic 与开发者的长期护城河

我基于 OpenAI 与 Anthropic 在 2026 年 4 月的官方动态,复盘了 AGI 竞争从模型能力转向组织记忆沉淀的趋势,以及开发者如何升级为长期系统经营者。

May 3, 2026·1 min read
AIAGIOpenAIAnthropicAgentDeveloper

AGI 进入“运行时主权层竞争”:OpenAI、Anthropic 与开发者的执行边界升级

我把最近 AGI 热点总结为一件事:模型能力在扩散,运行时主权在收敛,开发者的核心价值正转向定义执行边界与责任闭环。

May 2, 2026·1 min read
AIAGIOpenAIAnthropicDeveloperFutureEngineeringAgentSystemsCompounding

AGI 进入“复利层竞争”:OpenAI、Anthropic 与开发者的长期回报结构

我把 OpenAI 与 Anthropic 最近的能力迭代和算力扩张信号串起来后,发现 AGI 竞争正在进入复利层,开发者要升级为机器能力复利经理。

May 1, 2026·1 min read
AIAGIOpenAIAnthropicDeveloperFutureAgentSystemsEngineeringSLA

AGI 进入“验收层竞争”:OpenAI、Anthropic 与开发者的交付信用

April 30, 2026·1 min read
AIAGIOpenAIAnthropicDeveloperEngineering

AGI 进入“产能期权层竞争”:OpenAI、Anthropic 与开发者的未来形态

我把近期 AGI 热点归纳为一条主线:模型竞争正在升级为长期智能产能竞争,开发者角色也要从功能实现者转向产能投资者。

April 28, 2026·1 min read
AIAGIOpenAIAnthropicDeveloperFutureModelGovernanceEngineeringAgentSystems

AGI 进入“迁移层竞争”:OpenAI、Anthropic 与开发者的模型治理能力

最近官方动态让我更确信:AGI 竞争正从能力上限转向迁移与治理,开发者要升级成能把模型变化稳定转成业务结果的系统责任人。

April 27, 2026·1 min read
AIAGIOpenAIAnthropicDeveloperFutureAgentSystemsEngineeringWorkflow

AGI 进入“岗位编制重构”:OpenAI、Anthropic 与开发者的新协作合同

我复盘了 2026 年 4 月 OpenAI 与 Anthropic 的官方动作后,判断 AGI 竞争正在转向组织岗位编制重构,开发者要升级为人机协作系统的责任编排者。

April 26, 2026·1 min read
AIAGIOpenAIAnthropicDeveloperFutureAgentSystemsEvalsEngineering

AGI 进入“审计层竞争”:OpenAI、Anthropic 在扩张能力边界,开发者要把交付变成可证明系统

我最近的判断是:AGI 竞争已经从“谁更聪明”走向“谁更可证明”。OpenAI 与 Anthropic 在企业化和基础设施侧的最新动作,正在把开发者推向一个新角色:结果负责人 + 审计系统设计者。

April 25, 2026·1 min read
AIAGIOpenAIAnthropicDeveloperFutureAgentSystemsGovernanceEngineering

AGI 进入“责任层竞争”:OpenAI、Anthropic 在扩张执行能力,开发者要升级成结果负责人

我把 2026 年 4 月的官方信号串起来后发现:AGI 竞争正在从能力竞赛走向责任层竞赛,开发者的核心价值将是可问责交付。

April 24, 2026·1 min read
AIAGIOpenAIAnthropicDeveloperFutureAgentSystemsTrendsWorkflow

AGI 进入“分发层战争”:我为什么判断 OpenAI、Anthropic 正在重写开发者入口

我最近的判断是:AGI竞争正在从“谁更聪明”转向“谁掌握开发者与企业的工作流入口”。这会直接改写开发者未来三年的职业形态。

April 23, 2026·1 min read
AIAGIOpenAIAnthropicDeveloperFutureAgentSystemsTrends

AGI 进入“三角收敛”阶段:我看 OpenAI、Anthropic 与开发者的下一份工作说明书

我把近期热点归纳为一个结构:上游算力工业化、下游执行产品化、治理前置化,开发者角色正在被重写。

April 22, 2026·1 min read
AIAGIOpenAIAnthropicDeveloperFutureEvalsEngineering

AGI 进入评测时代:OpenAI、Anthropic 在重写开发者的工作定义

我最近的直观感受是:AI 时代的开发者竞争力,正在从“写得快”转向“定义评测、约束系统、稳定交付”。这篇写我对 OpenAI 与 Anthropic 近期动作的工程化判断。

April 21, 2026·1 min read
AIAGIOpenAIAnthropicAgentSystemsDeveloperFutureEngineering

AGI 进入“协议层竞争”:OpenAI、Anthropic 在定义接口,开发者要定义自己的执行产能

最近我最强的体感是:前沿公司的竞争重心正在从“更强模型”转向“更强执行接口”。谁能把 agent 的权限、评测、回滚、审计做成默认能力,谁就更接近 AGI 时代的真实操作系统。

April 20, 2026·1 min read
AIAGIOpenAIAnthropicDeveloperFutureAgentSystemsTrends

2026 Q2 的 AGI 热点:平台开始收敛,开发者要把自己做成“执行系统产品”

到 2026 年第二季度,AGI 竞争的核心正在从单点模型能力转向“可执行、可治理、可规模化”的系统能力。对开发者来说,未来形态不是更快写代码,而是更快搭建和经营一套可复用的执行系统。

April 18, 2026·1 min read
AIAGIOpenAIAnthropicDeveloperFutureAgentSystemsTrends

2026 的 AGI 热点,不在“更大模型”,而在“更强执行系统”

OpenAI 和 Anthropic 的最新动作都指向同一个事实:AGI 竞争正在从模型参数转向可执行系统。开发者的未来,不是被替代,而是升级为“智能系统操盘手”。

April 16, 2026·1 min read
AGIOpenAIAnthropicDeveloperFutureTrendsEngineering

AGI 进入“执行系统战争”:我对 OpenAI、Anthropic 与开发者新工种的判断

从 OpenAI 与 Anthropic 的最新公开信号出发,我给出一个工程视角判断:AGI 竞争正从模型能力转向执行系统能力,开发者将从写函数走向设计组织级执行系统。

April 15, 2026·1 min read
AIAGIOpenAIAnthropicAgentDeveloper

做 AGI 和造 AGI:OpenAI、Anthropic 与开发者的双螺旋进化

2026 年春天的 AGI 热点让我更确定:上游在做能力供给系统,下游开发者要把 AI 造进可交付执行系统。

April 14, 2026·1 min read
AIAGIOpenAIAnthropicAgentDeveloper

AGI 供给侧竞速:OpenAI、Anthropic 在造“智能电力系统”,开发者要造自己的执行层护城河

2026 年 AI 热点正在从模型发布转向供给系统建设。我的结论是:开发者真正的护城河,正转向可治理、可回滚、可复利的执行层能力。

April 14, 2026·1 min read
AIAGIOpenAIAnthropicDeveloperFutureAgentSystemsTrends

AGI 进入“组织操作系统”阶段:我对 OpenAI、Anthropic 2026 春季动作的判断

2026 年春天,OpenAI 和 Anthropic 的动作已经不只是模型迭代,而是组织级落地与治理能力的竞速。开发者的未来形态正在从“写功能的人”变成“编排智能系统的人”。

April 12, 2026·1 min read
AIAGIOpenAIAnthropicDeveloperFutureAgentSystems

AGI 双时钟竞争:OpenAI、Anthropic 在加速“造 AGI”,开发者要开始“造自己的系统公司”

2026 年 AGI 竞争进入双时钟:上游加速造能力,下游必须把能力做成可运营系统。开发者的核心价值,正在从写功能转向经营机器劳动力。

April 5, 2026·1 min read
AGIOpenAIAnthropicAIAgentSystemDesignWorkflowAutomation

AGI 应用层的真正分水岭:开发者正从写功能转向经营系统

当 OpenAI 与 Anthropic 把智能能力做成稳定供给,开发者的核心竞争力正从调用模型,转向设计流程、建设门禁、沉淀记忆,并把 AI 编排为可交付、可治理、可迁移的生产系统。

April 4, 2026·1 min read
AGIAIOpenAIAnthropicDeveloperAgentEngineeringTrends

AGI 不是一个模型,而是一条生产线:我对 OpenAI、Anthropic 与开发者未来形态的新判断

我最近重新梳理了 AGI 赛道的最新信号:OpenAI 与 Anthropic 正在把“模型能力”变成“可编排的系统能力”,开发者的核心竞争力也从写代码转向设计能力生产线。

April 3, 2026·1 min read
AGIAIOpenAIAnthropicDeveloperTrends

AGI 时代的两条战线:OpenAI/Anthropic 在造未来,开发者在重写自己

基于 2025-2026 的公开动态,我从个人开发者视角梳理 AGI 竞赛的变化:公司在抢算力和分发,开发者在向“系统设计者”迁移。

April 2, 2026·1 min read
AIAGIOpenAIAnthropicDeveloperEngineering

AGI 进入工程化拐点:OpenAI、Anthropic 在造“认知基建”,开发者要学会当系统设计者

我最近的判断是:AGI 竞争正在从“谁的模型更强”转向“谁能把能力变成稳定可复用的认知基础设施”,开发者角色也在随之重写。

April 1, 2026·1 min read
AIAGIAgentOpenAIAnthropicDeveloper

AGI 平台国家化:OpenAI、Anthropic 在造“能力基础设施”,我把自己改造成一人智能公司

我把 2026 年 AGI 热点归纳成一个现实变化:造 AGI 的公司在平台国家化,开发者需要把自己升级为可持续经营的个人智能公司。

March 29, 2026·1 min read
AIAGIAgentOpenAIAnthropicEngineering

AGI 双飞轮:OpenAI、Anthropic 在扩“智能供给”,我在重写开发者的“执行资本”

我把 2026 年 AGI 热点拆成两条线:前沿公司在扩智能供给,开发者要补执行资本,才能把模型能力变成稳定产能。

March 28, 2026·1 min read
AIAGIAgentOpenAIAnthropicEngineering

AGI Control Plane:OpenAI、Anthropic 在造“大脑”,我更关心开发者手里的“操作台”

2026 年开始,AI 竞争的关键正在从模型能力上限转向组织采用效率:开发者要把 AI 从工具变成可治理、可回滚、可持续交付的控制平面。

March 27, 2026·1 min read
AIAGIAgentOpenAIAnthropicEngineering

AGI 人才栈重排:OpenAI、Anthropic 在造未来模型,我在造 AI 同事系统

2026 年的关键不只是谁先做出更强模型,而是谁先把 AI 变成可治理、可复用、可持续交付的机器劳动力系统。

March 26, 2026·1 min read
AIAGIAgentOpenAIAnthropicEngineering

AGI 双线竞速:OpenAI、Anthropic 在造“通用智能”,我在造“代理工厂”

在 2026 年 3 月,我把 AGI 趋势拆成两条线:前沿公司造能力上限,开发者造机器劳动力系统。

March 24, 2026·1 min read
AIAGIAgentOpenAIAnthropicEngineering

AGI 产品化闭环:看 OpenAI、Anthropic 的推进节奏,我给自己重写了开发者说明书

在 2026 年 3 月,我更确定开发者竞争力正在从写功能转向设计可控、可治理、可复盘的智能系统闭环。

March 22, 2026·1 min read
AIAgentLLMEngineeringTrend

AGI 工程年:当 OpenAI 和 Anthropic 同时加速,开发者会变成什么样

站在 2026 年 3 月看 AGI 竞争,我更确定开发者的核心价值正在从写功能,转向设计可控、可评测、可交付的智能系统。

March 21, 2026·1 min read
AIAgentEngineeringWorkflowTrend

Context Engineering 2.0:我在 AI 时代盯的四个新热点

这周我把 Agent 项目复盘后,发现 2026 年真正拉开差距的,不再只是模型参数,而是上下文、动作、评测和路由这四个系统能力。

March 21, 2026·1 min read
AIAgentEngineeringWorkflowTrend

Inference Economics 2026:我在 AI 时代盯的四个最新热点

从本周技术信号看,AI 竞争主线正在从模型崇拜转向推理与交付工程。我总结了四个最值得持续下注的热点。

March 20, 2026·1 min read
AIAgentEngineeringTrends

2026 AI 热点观察:我为什么把重心从“追新模型”切到“做厚系统”

这一轮 AI 竞赛正在从单点模型能力,转向算力供给、Agent 工作流和迁移治理。我总结了自己在 2026 年做技术决策时最看重的三件事。

March 19, 2026·1 min read
AIAgentEngineeringArchitectureWorkflow

Swap-Ready Stack:模型周周更新后,我把 Agent 系统改成可热插拔架构

我把 Agent 架构拆成模型适配、工具契约、评测回放三层,让模型快速迭代不再打断交付。

March 18, 2026·1 min read
AIAgentEngineeringWorkflowInference

2026 AI 热点观察:我不再追参数,而是追“单位交付速度”

过去一年我对 AI 热点的判断发生了变化:模型能力依然重要,但真正决定团队产出的,是从能力到交付的最短路径。

March 16, 2026·1 min read
AIAgentEngineeringWorkflow

Action Interface 2026:我在 AI 时代追的三个热点,最后都落到同一套工程顺序

我把最近最热的 AI 趋势拆成可执行工程路径:先稳工具协议,再做分层路由,最后接观测与门禁。

March 15, 2026·1 min read
AIAgentEngineeringObservability

Agent Runtime Observability:我从会调用工具走到可观测交付的四个改造

我在 2026 年把 Agent 系统从“会调用工具”升级为“可观测、可回放、可拦截”的运行时架构,总结了四个最有效的工程改造。

March 14, 2026·1 min read
AIAgentLLMEngineering

我在 2026 年继续押注的 AI 技术方向

结合过去一年模型与基础设施的变化,我整理了 2026 年最值得投入的四条 AI 技术主线,以及我在工程落地中的取舍原则。

March 13, 2026·1 min read
AIAgentEngineeringWorkflow

Small Model First:我把 Agent 成本砍半后,总结了 2026 最实用的三层路由

2026 年 AI 热点不再只是模型能力竞赛,我把生产流程改成 Small Model First 三层路由后,成本、时延和可控性一起改善。

March 12, 2026·1 min read
AIAgentEngineeringWorkflow

AI Delivery Stack 2026:从热点到可交付系统,我在生产里改了四件事

2026 年 AI 热点很密集,但真正拉开差距的是交付结构:我把 Agent 平台化、工具协议化、成本工程化和治理前置做成了可复用闭环。

March 9, 2026·1 min read
AIAgentWorkflow

MCP Boundary:我给 Agent 的工具调用加了边界,稳定性反而更高了

我把 Agent 的工具权限从默认放开改成最小授权 + 显式审批 + 审计追踪后,交付稳定性比单纯追求模型能力提升更明显。

March 7, 2026·1 min read
AIEngineeringWorkflowLLM

Eval Gate:我把 AI 评测接进 CI,第一次在发布前拦住回归

我把最小 AI 评测体系接进 CI,把规则校验、场景回归和 LLM grader 分层运行,第一次在合并前拦住了质量回归。

March 5, 2026·1 min read
AIEngineeringWorkflowAgent

Agentic Reset:在 AI 时代给自己的技术栈留一条慢变量

模型、Agent、协议都在加速演进;我把热点折叠成三步工作流,让个人技术栈每周可升级、但不反复推倒。

March 4, 2026·1 min read
LifePersonalHabitsReset

Monday Reset:给周一留一个低噪启动仪式

我把周一从“冲刺日”改成“启动日”:先降噪、再定三件推进点、最后用一个最小动作开场,让这一周更稳地展开。

March 2, 2026·1 min read
LifeWeekendReset

Saturday Slow Morning:给周六留一个不赶时间的上午

这个周六我把上午从“赶时间”里拿出来,只留一个主任务,反而更稳。

February 28, 2026·1 min read
LifeWeekendFocus

Weekend Offline Walk:给周末留一段不拍照的出门

一次不拍照的周末出门,让我把注意力从分享欲拉回在场感。

February 27, 2026·1 min read
LifePersonalHabits

Wednesday Reset:周三晚上的低耗能重启法

我最近在实践一种周中自救方式:不靠意志力爆发,而是用一套低耗能流程把自己慢慢拉回状态。

February 25, 2026·1 min read
LLMInferenceSpeculative DecodingPerformance

Speculative Decoding:用「猜测-验证」让大模型推理快 2-3 倍

February 25, 2026·5 min read
LLMAttentionGPUPerformanceFlash Attention

Flash Attention:用 IO 感知重写注意力的底层算法

February 23, 2026·5 min read
Life

Evening Buffer|把傍晚留成缓冲区

我把傍晚当作一天的缓冲区,让工作与夜晚之间有个温柔的过渡。

February 18, 2026·1 min read
LLMInferenceKV CachePerformance

KV Cache:大模型推理的内存瓶颈与优化全景

February 18, 2026·6 min read
TransformerAttentionNLP深度学习

Attention Is All You Need:把“注意力”变成计算图里的核心算子

从 seq2seq 的瓶颈出发,梳理 Transformer 的关键设计:自注意力、多头、位置编码与掩码,并讨论它为什么有效、代价是什么,以及写代码时最容易踩的坑。

February 13, 2026·3 min read
AISystem Design

Understanding the Transformer: The Architecture That Rewired AI

A deep dive into why Transformers work, not just how they work.

February 7, 2026·9 min read

Fire and Rain — Why I Built Lumirain Studio

On naming a studio after contradictions, building tools that compress time, and coding at 3 AM.

February 7, 2026·5 min read