hua2003-liuの博客

发表于2026-05-12|AI应用

最近花时间研究了 Toonflow 这个项目，一个开源的 AI 短剧工厂工具。它的核心想法挺简单——把小说文本变成短剧视频，全流程自动化。但真正深入研究后，我发现它的系统设计有很多值得学习的地方，特别是 Agent 的设计和模块之间的协作方式。这篇文章从三个维度拆解 Toonflow：Agent 的定义架构、Agent 之间的协作机制、整个短剧创作的完整流程。三张架构图会穿插在文中，帮助理解设计思路。一、为什么要用 Agent 模式Toonflow 需要对接很多外部 AI 服务：大语言模型解析小说、图片生成模型画角色和分镜、视频生成模型生成视频片段。这些服务各自有不同的接口格式、调用方式、超时设置。把这些调用逻辑散落在业务代码里，后期维护会很麻烦。换一个 AI 服务提供商要改动大量代码，不同服务的重试策略也难以统一。 Toonflow 采用了经典的代理模式，设计了一个 BaseAgent 抽象基类。所有具体的 Agent（LlmAgent、ImageAgent、VideoAgent）都继承自这个基类，统一实现核心方法。这种设计让 AI 调用的逻辑得到封装和复用。二、Age...

Pi Top 20 热门扩展盘点

发表于2026-05-11|AI工具

pi.dev 上现在有 2400 多个扩展包，月下载量前 20 的加起来超过 50 万次。我来逐个介绍这些扩展。 pi-subagents — 70.6K/月让 AI 把任务委派给专注的子代理。内置 7 个专业代理： scout：快速本地代码库侦察，找到相关文件、入口点、数据流、风险，以及另一个代理应该从哪里开始 researcher：网络和文档研究，包括官方文档、规范、基准测试、最近变更，生成简洁的研究简报 planner：从现有上下文制定具体实现计划，只读和计划，不编辑代码 worker：实现工作，包括已批准的 oracle 交接，编辑文件、验证，遇到未批准的决策时升级而不是猜测 reviewer：代码审查和小修复，检查实现是否符合任务/计划、测试、边缘情况和简洁性 context-builder：规划前的更强设置阶段，收集代码上下文并编写交接材料如 context.md 和 meta-prompt.md oracle：行动前的第二意见，挑战假设、捕捉偏离、推荐最安全的下一步，不编辑文件可以用自然语言触发：”Use reviewer t...

SDLC、过程模型、方法论：AI 时代再审视

发表于2026-04-15|技术

面试里问”你们用什么开发模型”，十个有八个回答”敏捷”。继续问”敏捷和 Scrum 什么关系”，不少人就开始眼神飘忽。瀑布、迭代、敏捷、Scrum、DevOps——这些词不是一回事。它们分属三个层级：软件开发生命周期（SDLC）、软件过程模型、软件开发方法论。搞懂这层关系，选型时才不会瞎套。而 **2025 年被称为”Agent 元年”**，AI 编程从代码补全正式迈入智能体协作阶段。到 2026 年，Claude Code、Copilot Agent 这类工具已经进入日常开发的深水区。这篇文章先把基础概念理清楚，再深入常见的方法论，最后聊聊 AI 时代下需求分析和系统设计该怎么玩。一、三个概念，层级不同1. SDLC：软件的生老病死SDLC 是软件从诞生到退役必经的阶段：需求分析、系统设计、编码实现、测试验证、部署上线、运维迭代，最后下线。这些阶段是跑不掉的。不管团队用瀑布还是敏捷，设计、编码、测试一个都不会少。SDLC 只回答一个问题：有哪些事必须做。 2. 过程模型：阶段怎么排过程模型定义的是这些阶段以什么结构执行。是像流水线一样直线推进？还是切成小圈反复迭代？抑...

三个 AI Agent 工具对比：Claude Managed Agents、Hermes Agent、OpenClaw 选哪

发表于2026-04-09

做过 Agent 的人都明白：写核心逻辑不难，最痛苦的是把它稳定跑在生产环境里。容器编排、沙箱隔离、凭证管理、状态持久化、断点续跑——这些基础设施搭下来，几个月就过去了。最近三条路线都在解决这个痛点：Anthropic 官方托管、开源自进化引擎、网关生态。本文不聊架构黑话，直接说清楚它们各自擅长什么、适合谁。 TL;DR Claude Managed Agents：Anthropic 官方托管，你写逻辑，官方跑服务。适合企业或不想自己运维的人。 Hermes Agent：开源，自己托管。能记住你的习惯、会自己学新技能、还支持 18+ 种模型。适合喜欢折腾的发烧友。 OpenClaw：接聊天平台的网关， Telegram、Discord、WhatsApp 都能连。适合想把它当个人助手用的人。一、先问自己：你想用 AI Agent 做什么？选工具前，先搞清楚自己的场景。这三个工具的定位差别很大：你想做的事最适合的让 AI 自动处理工作流，一跑就是几小时，不用我盯着 Claude Managed Agents 在 Telegram/Disco...

AI Agent 入门：Anthropic 官方指南笔记

发表于2026-04-08|AI

花时间翻了 Anthropic 那篇《Building Effective Agents》，顺手整理成学习笔记。核心观点其实就一句：大多数成功的 Agent 实现，用的都是简单可组合的模式，而不是复杂的框架。 1. Agent 是什么：一句话 + 一个公式先区分两个概念： Workflows：通过预定义代码路径来编排 LLM 和工具，步骤是固定的 Agents：LLM 动态决定执行流程，自己选择下一步用什么工具 Agent 的核心循环就这一件事： 1用户输入 → LLM 思考 → 决定（回复 or 调用工具）→ 执行 → 把结果喂回去 → 重复 LLM 是大脑，工具是双手，记忆是笔记本。构建 Agent 的万能公式（套上去就能用）： 1Agent = 角色 + 目标 + 工具 + 规则 + 输出格式举个例子：要素内容角色加密项目研究助手目标找到准确信息并清晰总结工具网页搜索、文件搜索、计算器规则标注来源、不猜测、标注不确定的地方输出格式摘要 + 风险 + 机会 + 最终判断 2. 构建之前：先问自己四个问...

网络协议入门：HTTP、TCP/IP、DNS、SSH、FTP、SMTP、VPN

发表于2026-04-02|技术

一、TCP/IP：互联网的”快递系统”什么是 TCP/IP？TCP/IP 不是一种协议，而是一整套协议家族的统称。如果把互联网比作全球物流网络，TCP/IP 就是那套标准化的快递流程——不管你是从北京寄到上海，还是从纽约寄到伦敦，包裹的处理方式都一样。四层结构层级职责代表协议网络接口层负责物理网络上的数据帧传输 Ethernet、Wi-Fi 互联网层负责数据包的寻址和路由 IP 传输层负责主机之间的可靠传输 TCP、UDP 应用层直接与用户交互的协议 HTTP、FTP、SMTP TCP vs UDPTCP（传输控制协议）是面向连接的可靠传输协议。就像打电话——双方要先接通，才能对话。保证数据不丢失保证数据按顺序到达有错误校验和重传机制 UDP（用户数据报协议）是无连接的传输协议。就像发短信——不需要建立连接，直接发。速度快，开销小不保证数据到达适合实时性要求高的场景（游戏、直播）背景TCP/IP 的雏形诞生于 1973 年，由温顿·瑟夫和罗伯特·卡恩提出。198...

《平凡的世界》书摘 - 那些触动心灵的句子

发表于2025-11-04|生活随笔

关于平凡在我们亲爱的大地上，有多少朴素的花朵默默地开放在荒山野地里。这花朵没有人注目。也许唯有自身才怜爱自身的芬芳。关于生活生活包含着更广阔的意义，而不在于我们实际得到了什么；关键是我们的心灵是否充实。读书感悟这次重读《平凡的世界》，让我对生活有了新的理解。平凡不是平庸，而是在普通的生活中找到属于自己的意义。就像书中所说，重要的不是我们得到了什么，而是我们的心灵是否充实。这是我在 2025 年 11 月重读这本书时的摘抄和感悟。