Skip to content

Release history

chatgpt-on-wechat releases

CowAgent是基于大模型的超级AI助理,能主动思考和任务规划、访问操作系统和外部资源、创造和执行Skills、通过长期记忆和知识库不断成长,比OpenClaw更轻量和便捷。同时支持微信、飞书、钉钉、企微、QQ、公众号、网页等接入,可选择OpenAI/Claude/Gemini/DeepSeek/ Qwen/GLM/Kimi/LinkAI,能处理文本、语音、图片和文件,可快速搭建个人AI助理和企业数字员工。

All releases

11 shown

No immediate action
2.1.0 Mixed

New channels, i18n, CLI upgrades, MCP enhancements

No immediate action
2.0.9 Security relevant

Model management + MCP + security

patches CVE-2023-4863
Open
2.0.8 Breaking risk
⚠ Upgrade required
  • Feishu integration requires `lark-oapi>=1.5.5`; ensure this dependency is updated during upgrade.
  • Configuration may need adjustment if relying on the previous default model.
Breaking changes
  • Default LLM model changed from previous version to `deepseek-v4-flash`
Notable features
  • One‑click QR code onboarding for Feishu channel (no manual app creation)
  • Streaming card output with Markdown rendering in Feishu
  • Support for receiving and replying with voice messages via TTS/STT
Full changelog

v2.0.8: 飞书通道升级、模型新增、定时任务优化

飞书渠道全面升级

1. 一键扫码接入飞书

支持在web端或终端一键扫码接入飞书通道,不再需要手动到飞书开放平台建应用、填权限和事件订阅:

相关文档:飞书接入

2. 流式输出和Markdown渲染

支持飞书流式卡片输出效果,并支持Markdown渲染:

  • 多轮 Agent 场景下中间消息与最终回复分卡呈现
  • 针对 DeepSeek 等高频输出模型做了专门优化,速度与 Web 端持平
  • 要求飞书客户端 ≥ 7.20

3. 语音消息收发

支持接收用户发送的飞书语音消息并自动识别为文本,回复也可走 TTS 以语音形式发出。需配置语音识别及合成使用的模型厂商和相关key。

PR #2791 Thanks @ooaaooaa123

新模型支持

  • DeepSeek V4 系列:新增 deepseek-v4-pro / deepseek-v4-flash,并将默认模型切换为 deepseek-v4-flash
  • 思考模型开关统一:DeepSeek V4、Qwen3 等思考模型的开关行为对齐到 enable_thinking
  • 百度千帆模型接入:新增百度千帆厂商,支持 ernie-5.0ernie-4.5-turbo-128k 等模型,并支持图像识别工具,相关文档查看 百度千帆。PR #2790 Thanks @jimmyzhuu
  • 新增有道翻译translate 模块新增有道翻译支持。 PR #2797 Thanks @Zmjjeff7

定时任务记忆增强

  • 任务结果可被追问:定时任务的执行结果自动注入到接收方的会话历史中,下一轮对话可直接追问,无需重新交代上下文 Thanks @huangrichao2020
  • 不污染长期记忆:注入的调度对话不会被纳入每日梦境记忆汇总,避免高频任务把记忆刷满
  • 避免越跑越慢:调度任务自己的上下文长度自动控制在合理范围内,长期反复执行也不会越积越大、拖慢响应

OpenAI 客户端重构

  • 去 SDK 依赖:OpenAI SDK 改为原生 HTTP 实现,启动更轻、依赖冲突更少
  • Web 控制台提示:模型配置 API Base 输入框加入版本路径占位提示

工具与安全

  • 图像识别模型:让 tool.vision.model 配置真正生效,未配置时自动 fallback #2792 Thanks @CNXudiandian
  • Bash 安全确认:仅对工作区外的破坏性删除做二次确认,工作区内常规操作不再打扰

其他修复

  • 修复 Deep Dream 重复触发问题
  • 修复 DeepSeek 多轮对话中部分历史轮次缺失 reasoning_content

升级方式

源码部署可执行 cow update./run.sh update 一键升级,或手动拉取代码后重启。详见 更新升级文档

⚠️ 飞书一键创建应用依赖 lark-oapi>=1.5.5cow update 会自动拉取;手动部署请确保依赖已更新。

发布日期:2026.05.06 | Full Changelog

2.0.7 New feature
Notable features
  • Image generation skill supporting six vendors
  • Kimi K2.6, Claude Opus 4.7, GLM 5.1 support
  • Nested KB directory support
Full changelog

v2.0.7:图像生成技能、新模型支持、知识库和记忆优化

🎨 图像生成技能

新增图像生成内置技能,支持文生图、图生图、多图融合,支持 GPT-Image-2Nano Banana 等多种模型:

  • 自动路由:支持六种厂商模型自动切换,OpenAI (GPT-Image-2) → Gemini (Nano Banana) → Seedream (火山方舟) → Qwen (百炼) → MiniMax → LinkAI
  • 开箱即用:配置 API Key 即可使用,无需手动指定模型。也支持在对话中指定特定模型
  • 灵活控制:支持 quality(画质)、size(分辨率,512/1K~4K)、aspect_ratio(宽高比)等参数,各厂商自动适配有效值
  • 图片编辑:传入已有图片即可进行编辑、风格迁移、多图融合
  • Skill 级配置:支持通过 config.json 中的 skill.image-generation.model 固定默认模型

相关文档:图像生成技能

使用方式:内置技能默认开启,位置在 skills/image-generation

🤖 新模型支持

  • Kimi K2.6:新增 kimi-k2.6 模型支持
  • Claude Opus 4.7:新增 claude-opus-4-7 模型支持
  • GLM 5.1:新增 glm-5.1 模型支持
  • Kimi Coding Plan:支持 Kimi Coding Plan 模式
  • 自定义模型厂商:新增自定义模型提供方配置,方便接入本地模型及更多厂商

📚 知识库增强

  • 嵌套目录支持:知识库列表和展示支持多级嵌套目录
  • 根级文件展示:知识树中显示根目录下的 index.mdlog.md 等文件
  • 空状态统计修复:排除根级文件对知识库统计的干扰,正确保持空状态

🌙 梦境记忆优化

  • 结构化组织:梦境记忆文件按日期自动归档,目录结构更清晰
  • 定时抖动:每日定时触发增加随机抖动,避免集群场景下的并发冲突

🛠 技能系统改进

  • 技能管理刷新/skill 命令执行后自动加载最新技能,确保状态同步
  • 安装来源扩展:技能安装支持多种来源格式(URL、zip、本地文件等)

💬 Web 控制台优化

  • 智能自动滚动:优化聊天窗口滚动逻辑,用户手动翻阅时不再强制跳到底部 Thanks @colin2060
  • 移动端适配:侧边栏默认隐藏,支持点击遮罩关闭
  • 图片预览去重:修复同一消息中图片重复渲染的问题
  • 推理内容截断:深度思考内容超出阶段,解决前端卡顿问题
  • 会话标题修复:修复标题自动生成的回退逻辑

🐛 其他修复

  • Gemini 修复:修复 Gemini tool call 不返回结果的问题
  • Agent 重试:空响应重试时不再丢弃 tool_calls
  • Docker 环境变量:修复 Docker 环境下更新配置后环境变量未同步的问题 Thanks @sunboy0523
  • Python 3.7 兼容:延迟导入 Literal 以兼容 Python 3.7
  • 模型切换通知:修复切换模型后 bot_type 变更通知未显示的问题。Thanks @6vision
  • 配置命令增强/config 支持设置 enable_thinking

📦 升级方式

源码部署可执行 cow update./run.sh update 一键升级,或手动拉取代码后重启。详见 更新升级文档

发布日期:2026.04.22 | Full Changelog

2.0.6 New feature
Notable features
  • Local knowledge base with automatic organization, keyword and semantic search, and file tree visualization
  • Dream memory distillation: automatic daily consolidation of conversation memories into persistent long-term MEMORY.md
  • Web console: multi-session management, password protection, deep thinking display, and message copy
Full changelog

v2.0.6:本地知识库、梦境记忆、Web控制台升级

项目正式更名为 CowAgent

项目仓库正式从 chatgpt-on-wechat 更名为 CowAgent,演进为功能完备的超级 AI Agent 助理。

  • 新地址:github.com/zhayujie/CowAgent,旧地址 GitHub 会自动重定向
  • CLI 命令、配置文件、文档链接均保持兼容,无需额外操作

📚 知识库系统

新增本地知识库系统,Agent 可自主构建和维护结构化知识,并在对话中按需检索引用:

  • 索引驱动的自组织结构:知识库采用 knowledge/ 目录,按分类自动组织,每个知识页面为独立的 Markdown 文件
  • 自动写入:向 Agent 发送文件、链接等知识,或在讨论中识别到有价值的知识时,自动创建或更新知识页面
  • 混合检索:支持关键词全文搜索和向量语义检索,在对话中按需加载相关知识
  • 可视化:支持文件树浏览和知识图谱可视化,文档内链接可直接跳转查看
  • 命令管理/knowledge 查看统计、/knowledge list 查看目录结构、/knowledge on|off 开关知识库

相关文档:知识库

Inspired by Karpathy's LLM Wiki.

🌙 梦境记忆蒸馏(Deep Dream)

全新的记忆整理机制,每日自动将分散的对话记忆蒸馏为精炼的长期记忆:

  • 三层记忆流转:对话上下文(短期)→ 天级记忆(中期)→ MEMORY.md(长期),形成完整的记忆生命周期
  • 自动蒸馏:每日 23:55 定时执行,读取当天天级记忆和 MEMORY.md,通过 LLM 进行去重、合并、修剪,输出精炼的新版 MEMORY.md
  • 梦境日记:每次蒸馏生成一篇叙事风格的梦境日记,记录整理过程的发现和洞察,存储在 memory/dreams/ 目录
  • 手动触发:支持 /memory dream [N] 手动触发,可指定整理天数(默认 3 天,最大 30 天),完成后在对话中通知结果
  • Web 控制台:记忆管理页面新增「梦境日记」tab,可浏览和查看所有梦境日记

相关文档:梦境记忆

🧠 上下文智能压缩

上下文超出限制时将裁剪的部分通过 LLM 总结后异步注入,保持对话连贯性:

  • LLM 异步摘要:裁剪的消息由 LLM 总结为关键信息,同时写入天级记忆文件和注入保留的上下文
  • 多模型兼容:优先使用主模型进行摘要,兼容 Claude、OpenAI、MiniMax 等不同模型的消息格式要求

相关文档:短期记忆

💬 Web 控制台升级

Web 控制台多项功能增强:

  • 多会话管理:支持创建和切换多个独立会话,侧边栏展示会话列表,支持会话标题自动生成和手动编辑
  • 密码保护:支持为控制台设置登录密码,可通过 web_console_password 配置项控制 Thanks @sunboy0523
  • 深度思考:支持在 Web 端展示模型的思考过程,可通过enable_thinking 配置项控制
  • 定时推送:支持定时任务结果推送到 Web 控制台
  • 消息复制:AI 回复支持一键复制原始 Markdown 内容

相关文档:web控制台

🤖 模型相关

  • 视觉识别优化:图片识别工具优先使用主模型,支持多模型厂商自动降级。相关文档:视觉工具。Thanks @leafmove @caocos
  • MiniMax 新模型:新增 MiniMax-M2.7-highspeed 模型和 MiniMax TTS 语音合成支持。Thanks @octo-patch
  • 通义千问:新增 qwen3.6-plus 模型支持

🐛 其他优化与修复

  • 记忆提示词优化MEMORY.md 默认注入系统提示词,精细化记忆检索和写入的触发条件,增强主动写入能力
  • 系统提示词:优化系统提示词的风格和语气引导
  • 浏览器工具:增强隐式交互元素检测
  • 文件发送:修复通用文件类型(tar.gz、zip 等)未能正确发送的问题。Thanks @6vision
  • macOS 兼容:修复一键安装脚本中网络预检超时兼容性问题。Thanks @WilliamOnVoyage
  • Windows 兼容:修复 Windows 下 PowerShell 兼容性、进程更新、终端编码等多项问题
  • Python 3.13+:修复 Python 3.13 及以上版本缺少 legacy-cgi 依赖的问题 Thanks @sha156
  • 个人微信:更新个人微信通道版本 @zhayujie

📦 升级方式

源码部署可执行 cow update./run.sh update 一键升级,或手动拉取代码后重启。详见 更新升级文档

发布日期:2026.04.14 | Full Changelog

2.0.5 New feature
Security fixes
  • Memory Content path traversal vulnerability fix
Notable features
  • Cow CLI command system for terminal/chat control
  • Cow Skill Hub open source launch
  • Browser tool for web navigation and automation
2.0.4 New feature
Notable features
  • Personal WeChat channel with QR code login and credential persistence
  • MiniMax-M2.7 and GLM-5-Turbo model support
  • Enhanced script reliability and WebSocket compatibility
Full changelog

Release v2.0.4

🔌 新增个人微信通道

新增个人微信(weixin)通道,微信扫描二维码即可将 CowAgent 接入个人微信,基于微信官方API实现,支持以下功能:

  • 消息收发:支持文本、图片、文件、视频消息的接收与回复,支持语音消息接收和识别
  • 扫码登录:终端显示二维码,微信扫码确认即可登录,二维码过期自动刷新
  • 凭证持久化:登录凭证自动保存至 ~/.weixin_cow_credentials.json,重启无需重新扫码
  • Session 自动重连:Session 过期后自动清除旧凭证并重新发起扫码登录
  • Web 控制台接入:支持在 Web 控制台中添加微信通道,扫码登录流程同步展示
  • Docker 和脚本支持run.shdocker-compose.yml 均已适配微信通道

接入文档:微信接入

相关提交:ce89869

🤖 新增模型

  • MiniMax-M2.7:新增 MiniMax-M2.7 模型支持
  • GLM-5-Turbo:新增智谱 glm-5-turbo 模型支持

相关提交:9192f6f

🔧 脚本重构

  • run.sh 重构:提取公共逻辑,精简脚本代码(49d8707)
  • 可执行权限:修复 run.sh 文件权限问题 (652156e)
  • PID 获取:修复 run.sh 中进程 PID 获取错误的问题 (9febb07)

🌍 文档更新

新增完整的日文文档,覆盖入门指南、通道接入、模型配置等主要章节。Thanks @Ikko Ashimine

相关提交:5487c0b

🐛 问题修复

  • 企微机器人兼容:修复旧版 websocket-client 的兼容性问题,新增统一的 WebSocket 兼容层 (bc7f627)
  • 消息自动修复:增强消息协议的容错能力,自动修复格式异常的消息序列 (b8b57e3)
  • 飞书编码:修复飞书通道消息和日志的编码问题 (7d0e156)
  • 飞书配置:移除 run.sh 中对 feishu_bot_name 的冗余依赖 (1b5be1b)

📦 升级方式

源码部署可执行 ./run.sh update 一键升级,或手动拉取代码后重启。详见 更新升级文档

发布日期:2026.03.22 | Full Changelog

2.0.3 New feature
Notable features
  • WeChat enterprise bot and QQ channel support
  • Web console file upload with Office document parsing
  • Memory system upgrade with LLM summarization
2.0.2 New feature
Notable features
  • Web console streaming with reasoning/tool visualization
  • Multi-channel simultaneous running
  • Session persistence to SQLite
2.0.1 New feature
Notable features
  • Built-in Web Search tool
  • Smart context window management
  • Claude Opus 4.6 support
2.0.0 Breaking risk
Breaking changes
  • Major architectural transformation from chatbot to comprehensive agent system
Notable features
  • Complex task planning with multi-round reasoning
  • Long-term memory with vector search
  • 10+ built-in system tools (file ops, bash, browser, scheduling, memory management)
Full changelog

CowAgent 2.0

🚀 CowAgent 2.0 版本完成了从聊天机器人到 超级Agent助理 的全面升级!现在它能够主动思考和规划任务、拥有长期记忆、操作计算机和外部资源、创造和执行技能,真正理解你并和你一起成长。

✨ 重点更新

  • Agent核心能力:

    • 复杂任务规划:能够理解复杂任务并自主规划执行,持续思考和调用工具直到完成目标,支持多轮推理和上下文理解。
    • 长期记忆:自动将对话记忆持久化至本地文件和数据库中,包括全局记忆和天级记忆,支持关键词及向量检索。
    • 内置系统工具:内置实现10+种工具,包括文件操作、bash终端、浏览器、文件发送、定时任务、记忆管理等。
    • Skills:新增Skill运行引擎,内置多种技能,并支持通过自然语言对话完成自定义Skills开发。
    • 安全和成本:通过秘钥管理工具、提示词控制、系统权限等手段控制Agent的访问安全;通过最大记忆轮次、最大上下文token、工具执行步数对token成本进行限制。
  • 其他更新:

    • 渠道优化:飞书及钉钉接入渠道支持长连接接入(无需公网IP)、支持图片/文件消息的接收和发送。
    • 模型更新:新增claude-sonnet-4-5、gemini-3-pro-preview、glm-4.7、MiniMax-M2.1、qwen3-max等最新模型。
    • 部署优化:增加一键安装、配置、运行、管理的脚本,简化部署流程。

📖 详细介绍:CowAgent 2.0

一、长期记忆系统

Agent 会在用户分享重要信息时主动存储,也会在对话达到一定长度时自动提取摘要。支持语义搜索和向量检索的混合检索模式。

  • 首次启动时,Agent 会主动询问关键信息,并记录至工作空间(默认 ~/cow)中的智能体设定、用户身份、记忆文件中。
  • 长期对话中,Agent 会智能记录或检索记忆,不断更新自身设定、用户偏好、工作习惯,总结经验和教训,真正实现自主思考和持续成长。

二、任务规划与工具调用

Agent 根据任务需求智能选择和调用工具,完成各类复杂操作。

1. 终端和文件访问

最基础和核心的工具能力,用户可通过手机端与 Agent 交互,操作个人电脑或服务器上的资源:

2. 应用编程能力

基于编程能力和系统访问能力,Agent 可实现从信息搜索、素材生成、编码、测试、部署、Nginx配置、发布的 Vibecoding 全流程,通过手机端一句命令完成应用快速 demo。

3. 定时任务

支持 一次性任务、固定时间间隔、Cron表达式 三种形式,任务触发可选择 固定消息发送Agent动态任务执行 两种模式:

4. 环境变量管理

通过 env_config 工具管理技能所需秘钥,支持对话式更新,内置安全保护和脱敏策略:

三、技能系统

每个 Skill 由说明文件、运行脚本(可选)、资源(可选)组成,为 Agent 提供无限扩展性。

1. 技能创造器

通过对话方式快速创建技能,将工作流程固化或对接任意第三方接口:

2. 搜索和图像识别

  • 搜索技能:内置 bocha-search(博查搜索),配置 BOCHA_SEARCH_API_KEY 即可使用。
  • 图像识别:支持 gpt-4.1-minigpt-4.1 等模型,配置 OPENAI_API_KEY 即可使用。

3. 三方知识库和插件

linkai-agent 技能可将 LinkAI 上的所有智能体作为 Skill 使用,实现多智能体决策:

四、快速开始

1.一键启动

本次新增了一键下载、配置、运行和管理的脚本,只需命令行中执行:

bash <(curl -sS https://cdn.link-ai.tech/code/cow/run.sh)

详细说明参考:项目启动脚本

已有项目的用户,拉取最新代码后设置 config.json 中的 agent 字段为true即可启用最新Agent模式。

2.模型选择

Agent 模式推荐使用以下模型:

  • Claude: claude-sonnet-4-5claude-sonnet-4-0
  • Gemini: gemini-3-flash-previewgemini-3-pro-preview
  • GLM: glm-4.7
  • MiniMax: MiniMax-M2.1
  • Qwen: qwen3-max

详细配置方式参考 模型说明

3.渠道接入

支持在 Web、飞书、钉钉、企业微信 等多渠道与 Agent 交互,随时随地使用超级助理,只需修改 config.json 中的 channel_type 配置即可切换:

更多渠道配置参考:通道说明

五、参与共建

2.0版本后,项目将持续升级Agent能力、拓展接入渠道、内置工具、技能系统,降低模型成本和提升安全性。欢迎 提出反馈贡献代码

🤖 立即体验 CowAgent 2.0,开启你的超级AI助理之旅!

Beta — feedback welcome: [email protected]