Release history
chatgpt-on-wechat releases
CowAgent是基于大模型的超级AI助理,能主动思考和任务规划、访问操作系统和外部资源、创造和执行Skills、通过长期记忆和知识库不断成长,比OpenClaw更轻量和便捷。同时支持微信、飞书、钉钉、企微、QQ、公众号、网页等接入,可选择OpenAI/Claude/Gemini/DeepSeek/ Qwen/GLM/Kimi/LinkAI,能处理文本、语音、图片和文件,可快速搭建个人AI助理和企业数字员工。
All releases
11 shown
Model management + MCP + security
- Feishu integration requires `lark-oapi>=1.5.5`; ensure this dependency is updated during upgrade.
- Configuration may need adjustment if relying on the previous default model.
- Default LLM model changed from previous version to `deepseek-v4-flash`
- One‑click QR code onboarding for Feishu channel (no manual app creation)
- Streaming card output with Markdown rendering in Feishu
- Support for receiving and replying with voice messages via TTS/STT
Full changelog
v2.0.8: 飞书通道升级、模型新增、定时任务优化
飞书渠道全面升级
1. 一键扫码接入飞书
支持在web端或终端一键扫码接入飞书通道,不再需要手动到飞书开放平台建应用、填权限和事件订阅:
相关文档:飞书接入
2. 流式输出和Markdown渲染
支持飞书流式卡片输出效果,并支持Markdown渲染:
- 多轮 Agent 场景下中间消息与最终回复分卡呈现
- 针对 DeepSeek 等高频输出模型做了专门优化,速度与 Web 端持平
- 要求飞书客户端 ≥ 7.20
3. 语音消息收发
支持接收用户发送的飞书语音消息并自动识别为文本,回复也可走 TTS 以语音形式发出。需配置语音识别及合成使用的模型厂商和相关key。
PR #2791 Thanks @ooaaooaa123
新模型支持
- DeepSeek V4 系列:新增
deepseek-v4-pro/deepseek-v4-flash,并将默认模型切换为deepseek-v4-flash - 思考模型开关统一:DeepSeek V4、Qwen3 等思考模型的开关行为对齐到
enable_thinking - 百度千帆模型接入:新增百度千帆厂商,支持
ernie-5.0、ernie-4.5-turbo-128k等模型,并支持图像识别工具,相关文档查看 百度千帆。PR #2790 Thanks @jimmyzhuu - 新增有道翻译:
translate模块新增有道翻译支持。 PR #2797 Thanks @Zmjjeff7
定时任务记忆增强
- 任务结果可被追问:定时任务的执行结果自动注入到接收方的会话历史中,下一轮对话可直接追问,无需重新交代上下文 Thanks @huangrichao2020
- 不污染长期记忆:注入的调度对话不会被纳入每日梦境记忆汇总,避免高频任务把记忆刷满
- 避免越跑越慢:调度任务自己的上下文长度自动控制在合理范围内,长期反复执行也不会越积越大、拖慢响应
OpenAI 客户端重构
- 去 SDK 依赖:OpenAI SDK 改为原生 HTTP 实现,启动更轻、依赖冲突更少
- Web 控制台提示:模型配置 API Base 输入框加入版本路径占位提示
工具与安全
- 图像识别模型:让
tool.vision.model配置真正生效,未配置时自动 fallback #2792 Thanks @CNXudiandian - Bash 安全确认:仅对工作区外的破坏性删除做二次确认,工作区内常规操作不再打扰
其他修复
- 修复 Deep Dream 重复触发问题
- 修复 DeepSeek 多轮对话中部分历史轮次缺失
reasoning_content
升级方式
源码部署可执行 cow update 或 ./run.sh update 一键升级,或手动拉取代码后重启。详见 更新升级文档。
⚠️ 飞书一键创建应用依赖
lark-oapi>=1.5.5,cow update会自动拉取;手动部署请确保依赖已更新。
发布日期:2026.05.06 | Full Changelog
- Image generation skill supporting six vendors
- Kimi K2.6, Claude Opus 4.7, GLM 5.1 support
- Nested KB directory support
Full changelog
v2.0.7:图像生成技能、新模型支持、知识库和记忆优化
🎨 图像生成技能
新增图像生成内置技能,支持文生图、图生图、多图融合,支持 GPT-Image-2、Nano Banana 等多种模型:
- 自动路由:支持六种厂商模型自动切换,OpenAI (GPT-Image-2) → Gemini (Nano Banana) → Seedream (火山方舟) → Qwen (百炼) → MiniMax → LinkAI
- 开箱即用:配置 API Key 即可使用,无需手动指定模型。也支持在对话中指定特定模型
- 灵活控制:支持
quality(画质)、size(分辨率,512/1K~4K)、aspect_ratio(宽高比)等参数,各厂商自动适配有效值 - 图片编辑:传入已有图片即可进行编辑、风格迁移、多图融合
- Skill 级配置:支持通过
config.json中的skill.image-generation.model固定默认模型
相关文档:图像生成技能
使用方式:内置技能默认开启,位置在 skills/image-generation
🤖 新模型支持
- Kimi K2.6:新增
kimi-k2.6模型支持 - Claude Opus 4.7:新增
claude-opus-4-7模型支持 - GLM 5.1:新增
glm-5.1模型支持 - Kimi Coding Plan:支持 Kimi Coding Plan 模式
- 自定义模型厂商:新增自定义模型提供方配置,方便接入本地模型及更多厂商
📚 知识库增强
- 嵌套目录支持:知识库列表和展示支持多级嵌套目录
- 根级文件展示:知识树中显示根目录下的
index.md、log.md等文件 - 空状态统计修复:排除根级文件对知识库统计的干扰,正确保持空状态
🌙 梦境记忆优化
- 结构化组织:梦境记忆文件按日期自动归档,目录结构更清晰
- 定时抖动:每日定时触发增加随机抖动,避免集群场景下的并发冲突
🛠 技能系统改进
- 技能管理刷新:
/skill命令执行后自动加载最新技能,确保状态同步 - 安装来源扩展:技能安装支持多种来源格式(URL、zip、本地文件等)
💬 Web 控制台优化
- 智能自动滚动:优化聊天窗口滚动逻辑,用户手动翻阅时不再强制跳到底部 Thanks @colin2060
- 移动端适配:侧边栏默认隐藏,支持点击遮罩关闭
- 图片预览去重:修复同一消息中图片重复渲染的问题
- 推理内容截断:深度思考内容超出阶段,解决前端卡顿问题
- 会话标题修复:修复标题自动生成的回退逻辑
🐛 其他修复
- Gemini 修复:修复 Gemini tool call 不返回结果的问题
- Agent 重试:空响应重试时不再丢弃 tool_calls
- Docker 环境变量:修复 Docker 环境下更新配置后环境变量未同步的问题 Thanks @sunboy0523
- Python 3.7 兼容:延迟导入
Literal以兼容 Python 3.7 - 模型切换通知:修复切换模型后 bot_type 变更通知未显示的问题。Thanks @6vision
- 配置命令增强:
/config支持设置enable_thinking
📦 升级方式
源码部署可执行 cow update 或 ./run.sh update 一键升级,或手动拉取代码后重启。详见 更新升级文档。
发布日期:2026.04.22 | Full Changelog
- Local knowledge base with automatic organization, keyword and semantic search, and file tree visualization
- Dream memory distillation: automatic daily consolidation of conversation memories into persistent long-term MEMORY.md
- Web console: multi-session management, password protection, deep thinking display, and message copy
Full changelog
v2.0.6:本地知识库、梦境记忆、Web控制台升级
项目正式更名为 CowAgent
项目仓库正式从 chatgpt-on-wechat 更名为 CowAgent,演进为功能完备的超级 AI Agent 助理。
- 新地址:github.com/zhayujie/CowAgent,旧地址 GitHub 会自动重定向
- CLI 命令、配置文件、文档链接均保持兼容,无需额外操作
📚 知识库系统
新增本地知识库系统,Agent 可自主构建和维护结构化知识,并在对话中按需检索引用:
- 索引驱动的自组织结构:知识库采用
knowledge/目录,按分类自动组织,每个知识页面为独立的 Markdown 文件 - 自动写入:向 Agent 发送文件、链接等知识,或在讨论中识别到有价值的知识时,自动创建或更新知识页面
- 混合检索:支持关键词全文搜索和向量语义检索,在对话中按需加载相关知识
- 可视化:支持文件树浏览和知识图谱可视化,文档内链接可直接跳转查看
- 命令管理:
/knowledge查看统计、/knowledge list查看目录结构、/knowledge on|off开关知识库
相关文档:知识库
Inspired by Karpathy's LLM Wiki.
🌙 梦境记忆蒸馏(Deep Dream)
全新的记忆整理机制,每日自动将分散的对话记忆蒸馏为精炼的长期记忆:
- 三层记忆流转:对话上下文(短期)→ 天级记忆(中期)→ MEMORY.md(长期),形成完整的记忆生命周期
- 自动蒸馏:每日 23:55 定时执行,读取当天天级记忆和 MEMORY.md,通过 LLM 进行去重、合并、修剪,输出精炼的新版 MEMORY.md
- 梦境日记:每次蒸馏生成一篇叙事风格的梦境日记,记录整理过程的发现和洞察,存储在
memory/dreams/目录 - 手动触发:支持
/memory dream [N]手动触发,可指定整理天数(默认 3 天,最大 30 天),完成后在对话中通知结果 - Web 控制台:记忆管理页面新增「梦境日记」tab,可浏览和查看所有梦境日记
相关文档:梦境记忆
🧠 上下文智能压缩
上下文超出限制时将裁剪的部分通过 LLM 总结后异步注入,保持对话连贯性:
- LLM 异步摘要:裁剪的消息由 LLM 总结为关键信息,同时写入天级记忆文件和注入保留的上下文
- 多模型兼容:优先使用主模型进行摘要,兼容 Claude、OpenAI、MiniMax 等不同模型的消息格式要求
相关文档:短期记忆
💬 Web 控制台升级
Web 控制台多项功能增强:
- 多会话管理:支持创建和切换多个独立会话,侧边栏展示会话列表,支持会话标题自动生成和手动编辑
- 密码保护:支持为控制台设置登录密码,可通过
web_console_password配置项控制 Thanks @sunboy0523 - 深度思考:支持在 Web 端展示模型的思考过程,可通过
enable_thinking配置项控制 - 定时推送:支持定时任务结果推送到 Web 控制台
- 消息复制:AI 回复支持一键复制原始 Markdown 内容
相关文档:web控制台
🤖 模型相关
- 视觉识别优化:图片识别工具优先使用主模型,支持多模型厂商自动降级。相关文档:视觉工具。Thanks @leafmove @caocos
- MiniMax 新模型:新增 MiniMax-M2.7-highspeed 模型和 MiniMax TTS 语音合成支持。Thanks @octo-patch
- 通义千问:新增 qwen3.6-plus 模型支持
🐛 其他优化与修复
- 记忆提示词优化:
MEMORY.md默认注入系统提示词,精细化记忆检索和写入的触发条件,增强主动写入能力 - 系统提示词:优化系统提示词的风格和语气引导
- 浏览器工具:增强隐式交互元素检测
- 文件发送:修复通用文件类型(tar.gz、zip 等)未能正确发送的问题。Thanks @6vision
- macOS 兼容:修复一键安装脚本中网络预检超时兼容性问题。Thanks @WilliamOnVoyage
- Windows 兼容:修复 Windows 下 PowerShell 兼容性、进程更新、终端编码等多项问题
- Python 3.13+:修复 Python 3.13 及以上版本缺少
legacy-cgi依赖的问题 Thanks @sha156 - 个人微信:更新个人微信通道版本 @zhayujie
📦 升级方式
源码部署可执行 cow update 或 ./run.sh update 一键升级,或手动拉取代码后重启。详见 更新升级文档。
发布日期:2026.04.14 | Full Changelog
- Memory Content path traversal vulnerability fix
- Cow CLI command system for terminal/chat control
- Cow Skill Hub open source launch
- Browser tool for web navigation and automation
- Personal WeChat channel with QR code login and credential persistence
- MiniMax-M2.7 and GLM-5-Turbo model support
- Enhanced script reliability and WebSocket compatibility
Full changelog
Release v2.0.4
🔌 新增个人微信通道
新增个人微信(weixin)通道,微信扫描二维码即可将 CowAgent 接入个人微信,基于微信官方API实现,支持以下功能:
- 消息收发:支持文本、图片、文件、视频消息的接收与回复,支持语音消息接收和识别
- 扫码登录:终端显示二维码,微信扫码确认即可登录,二维码过期自动刷新
- 凭证持久化:登录凭证自动保存至
~/.weixin_cow_credentials.json,重启无需重新扫码 - Session 自动重连:Session 过期后自动清除旧凭证并重新发起扫码登录
- Web 控制台接入:支持在 Web 控制台中添加微信通道,扫码登录流程同步展示
- Docker 和脚本支持:
run.sh和docker-compose.yml均已适配微信通道
接入文档:微信接入
相关提交:ce89869
🤖 新增模型
- MiniMax-M2.7:新增 MiniMax-M2.7 模型支持
- GLM-5-Turbo:新增智谱 glm-5-turbo 模型支持
相关提交:9192f6f
🔧 脚本重构
- run.sh 重构:提取公共逻辑,精简脚本代码(49d8707)
- 可执行权限:修复
run.sh文件权限问题 (652156e) - PID 获取:修复
run.sh中进程 PID 获取错误的问题 (9febb07)
🌍 文档更新
新增完整的日文文档,覆盖入门指南、通道接入、模型配置等主要章节。Thanks @Ikko Ashimine
相关提交:5487c0b
🐛 问题修复
- 企微机器人兼容:修复旧版
websocket-client的兼容性问题,新增统一的 WebSocket 兼容层 (bc7f627) - 消息自动修复:增强消息协议的容错能力,自动修复格式异常的消息序列 (b8b57e3)
- 飞书编码:修复飞书通道消息和日志的编码问题 (7d0e156)
- 飞书配置:移除
run.sh中对feishu_bot_name的冗余依赖 (1b5be1b)
📦 升级方式
源码部署可执行 ./run.sh update 一键升级,或手动拉取代码后重启。详见 更新升级文档。
发布日期:2026.03.22 | Full Changelog
- WeChat enterprise bot and QQ channel support
- Web console file upload with Office document parsing
- Memory system upgrade with LLM summarization
- Web console streaming with reasoning/tool visualization
- Multi-channel simultaneous running
- Session persistence to SQLite
- Built-in Web Search tool
- Smart context window management
- Claude Opus 4.6 support
- Major architectural transformation from chatbot to comprehensive agent system
- Complex task planning with multi-round reasoning
- Long-term memory with vector search
- 10+ built-in system tools (file ops, bash, browser, scheduling, memory management)
Full changelog
CowAgent 2.0
🚀 CowAgent 2.0 版本完成了从聊天机器人到 超级Agent助理 的全面升级!现在它能够主动思考和规划任务、拥有长期记忆、操作计算机和外部资源、创造和执行技能,真正理解你并和你一起成长。
✨ 重点更新
-
Agent核心能力:
- 复杂任务规划:能够理解复杂任务并自主规划执行,持续思考和调用工具直到完成目标,支持多轮推理和上下文理解。
- 长期记忆:自动将对话记忆持久化至本地文件和数据库中,包括全局记忆和天级记忆,支持关键词及向量检索。
- 内置系统工具:内置实现10+种工具,包括文件操作、bash终端、浏览器、文件发送、定时任务、记忆管理等。
- Skills:新增Skill运行引擎,内置多种技能,并支持通过自然语言对话完成自定义Skills开发。
- 安全和成本:通过秘钥管理工具、提示词控制、系统权限等手段控制Agent的访问安全;通过最大记忆轮次、最大上下文token、工具执行步数对token成本进行限制。
-
其他更新:
- 渠道优化:飞书及钉钉接入渠道支持长连接接入(无需公网IP)、支持图片/文件消息的接收和发送。
- 模型更新:新增claude-sonnet-4-5、gemini-3-pro-preview、glm-4.7、MiniMax-M2.1、qwen3-max等最新模型。
- 部署优化:增加一键安装、配置、运行、管理的脚本,简化部署流程。
📖 详细介绍:CowAgent 2.0
一、长期记忆系统
Agent 会在用户分享重要信息时主动存储,也会在对话达到一定长度时自动提取摘要。支持语义搜索和向量检索的混合检索模式。
- 首次启动时,Agent 会主动询问关键信息,并记录至工作空间(默认
~/cow)中的智能体设定、用户身份、记忆文件中。 - 长期对话中,Agent 会智能记录或检索记忆,不断更新自身设定、用户偏好、工作习惯,总结经验和教训,真正实现自主思考和持续成长。
二、任务规划与工具调用
Agent 根据任务需求智能选择和调用工具,完成各类复杂操作。
1. 终端和文件访问
最基础和核心的工具能力,用户可通过手机端与 Agent 交互,操作个人电脑或服务器上的资源:
2. 应用编程能力
基于编程能力和系统访问能力,Agent 可实现从信息搜索、素材生成、编码、测试、部署、Nginx配置、发布的 Vibecoding 全流程,通过手机端一句命令完成应用快速 demo。
3. 定时任务
支持 一次性任务、固定时间间隔、Cron表达式 三种形式,任务触发可选择 固定消息发送 或 Agent动态任务执行 两种模式:
4. 环境变量管理
通过 env_config 工具管理技能所需秘钥,支持对话式更新,内置安全保护和脱敏策略:
三、技能系统
每个 Skill 由说明文件、运行脚本(可选)、资源(可选)组成,为 Agent 提供无限扩展性。
1. 技能创造器
通过对话方式快速创建技能,将工作流程固化或对接任意第三方接口:
2. 搜索和图像识别
- 搜索技能:内置
bocha-search(博查搜索),配置BOCHA_SEARCH_API_KEY即可使用。 - 图像识别:支持
gpt-4.1-mini、gpt-4.1等模型,配置OPENAI_API_KEY即可使用。
3. 三方知识库和插件
linkai-agent 技能可将 LinkAI 上的所有智能体作为 Skill 使用,实现多智能体决策:
四、快速开始
1.一键启动
本次新增了一键下载、配置、运行和管理的脚本,只需命令行中执行:
bash <(curl -sS https://cdn.link-ai.tech/code/cow/run.sh)
详细说明参考:项目启动脚本
已有项目的用户,拉取最新代码后设置
config.json中的agent字段为true即可启用最新Agent模式。
2.模型选择
Agent 模式推荐使用以下模型:
- Claude:
claude-sonnet-4-5、claude-sonnet-4-0 - Gemini:
gemini-3-flash-preview、gemini-3-pro-preview - GLM:
glm-4.7 - MiniMax:
MiniMax-M2.1 - Qwen:
qwen3-max
详细配置方式参考 模型说明
3.渠道接入
支持在 Web、飞书、钉钉、企业微信 等多渠道与 Agent 交互,随时随地使用超级助理,只需修改 config.json 中的 channel_type 配置即可切换:
更多渠道配置参考:通道说明
五、参与共建
2.0版本后,项目将持续升级Agent能力、拓展接入渠道、内置工具、技能系统,降低模型成本和提升安全性。欢迎 提出反馈 和 贡献代码。
🤖 立即体验 CowAgent 2.0,开启你的超级AI助理之旅!