全速加载中...
首页
文章
随笔
留言
友链
关于
工具
更多
湘ICP备2021007748号-4
湘公网安备案湘公网安备43052202000137号
又拍云

省 Token、管游戏、测安全:GitHub Trending 7 个实用开源项目

当 AI 开始学会"省着说"

2026 年的开源世界正在发生一件有趣的事:开发者们不再一味追求更大的模型、更多的功能,而是开始思考如何让 AI 更高效、更轻量、更尊重你的时间和钱包。今天从 GitHub Trending 精选的 7 个项目,就完美诠释了这一趋势——从让 AI 说话更少的工具,到完全本地运行的会议助手;从控制网页的智能体,到管理复古游戏的精美界面。


Caveman:让 AI 说话更少,省下的都是真金白银

如果你每天都在和 Claude Code、Codex 或 Gemini 打交道,那你一定对 token 消耗心有余悸。Caveman 提供了一个脑洞大开却极其有效的解决方案:让你的 AI 编码助手用"穴居人风格"说话。

这个项目安装后,AI 的输出 token 平均减少了 65%,而且技术准确性保持 100%。它不是让 AI 变笨,而是去掉所有废话——没有"好的,我来帮你看看这个问题",没有"根据我的分析",直接上干货。比如原本需要 69 个 token 的解释,现在 19 个就够了。

更妙的是,它有六个级别可选,从简单的精简到文言文模式(wenyan),甚至支持中文。安装只需一条命令,支持 Claude Code、Codex、Cursor、Windsurf 等 30 多个编码代理。

https://github.com/JuliusBrussee/caveman

适合人群:所有被 AI 编码助手 token 账单吓到的开发者


Page Agent:用自然语言操控网页,阿里巴巴出品

网页自动化一直是个痛点——要么需要 Selenium 那种重型工具,要么依赖截图和多模态 LLM。Page Agent 另辟蹊径:它直接在页面内运行 JavaScript,通过文本化的 DOM 操作来实现自动化,不需要浏览器扩展、Python 或无头浏览器。

你可以在自己的网站里嵌入一行 script 标签,就能获得一个 AI 驱动的页面助手。用户说"点击登录按钮",Agent 就去操作。它支持自带 LLM,也提供了免费的 Demo LLM 用于快速体验。阿里官方维护,代码质量有保障。

应用场景非常丰富:给 SaaS 产品内置 AI Copilot、把 20 步的表单填写变成一句话、让残障人士通过语音指令操作任何网页应用。它还支持 MCP Server,可以从外部控制浏览器。

https://github.com/alibaba/page-agent

适合人群:产品经理、前端开发者、希望给产品加 AI 功能的团队


Meetily:完全本地的 AI 会议助手,隐私零妥协

会议录音转写已经是红海市场,但 Meetily 选择了一条不同的路:所有数据处理都在本地完成,不经过任何云端服务器。对于法律、医疗、国防等对数据主权要求极高的行业来说,这不仅仅是加分项,而是刚需。

Meetily 基于 Tauri(Rust + Next.js)构建,体积小巧。它支持实时转录,使用 Parakeet 或 Whisper 模型,速度比传统方案快 4 倍。摘要生成可以选择 Ollama(完全本地)、Claude、Groq 等多种 AI 提供商。音频采集支持麦克风 + 系统声音同时录制,还有智能降噪。

最关键的是:没有数据泄露风险。所有转录记录、音频文件、摘要结果都存储在你自己的设备上。macOS、Windows、Linux 全平台支持,GPU 加速也全覆盖。

https://github.com/Zackriya-Solutions/meetily

适合人群:重视隐私的专业人士、企业合规团队、不想让会议内容上传云端的用户


RomM:给你的复古游戏收藏一个漂亮的自托管主页

如果你有一大堆 ROM 文件散落在各个文件夹里,每次找游戏都像在玩寻宝游戏,那 RomM 就是你的救星。它是一个功能强大且界面精美的自托管 ROM 管理器,支持 400 多个平台的元数据。

扫描你的游戏目录后,RomM 会自动从 IGDB、Screenscraper、MobyGames 获取游戏信息,从 SteamGridDB 拉取封面图,还能显示 RetroAchievements 的成就数据。你可以直接在浏览器里通过 EmulatorJS 玩游戏,甚至支持多磁盘游戏、DLC、MOD 和说明书。

它还有官方开发的 Playnite 插件、Android 客户端,以及社区贡献的 Switch 自制软件。多用户权限管理意味着你可以和朋友分享你的游戏库。

https://github.com/rommapp/romm

适合人群:复古游戏爱好者、EmuDeck/RetroArch 用户、NAS 玩家


Herdr:终端里的智能体调度中心,tmux 的 Agent 进化版

当你同时运行多个 AI 编码代理(Claude Code、Codex、Cursor Agent 等)时,如何高效管理它们是个大问题。Herdr 给出了答案:一个轻量级的终端多路复用器,专为 AI Agent 设计。

它不是 tmux 的简单复刻,而是针对 Agent 场景做了深度优化。每个 Agent 拥有独立的真实终端窗口(不是模拟的),支持全屏 TUI 渲染。侧边栏一目了然地显示每个 Agent 的状态:🔴 阻塞、🟡 工作中、🔵 完成、🟢 空闲。

最酷的功能是持久化——关闭笔记本再打开,Agent 还在运行,重新连接即可。支持通过 SSH 从手机远程管理。整个项目只有一个约 10MB 的 Rust 二进制文件,无依赖、无 GUI、无遥测。

https://github.com/ogulcancelik/herdr

适合人群:同时使用多个 AI 编码代理的高级开发者、喜欢终端工作流的技术极客


Strix:开源 AI 渗透测试工具,自动找漏洞并修复

网络安全领域迎来了一位重量级选手。Strix 是一套自主 AI 渗透测试代理,能够像真正的黑客一样动态运行你的代码、发现漏洞,并通过实际的 Proof of Concept 来验证。

与传统的静态扫描工具不同,Strix 的每个发现都附带可复现的漏洞利用代码,彻底告别误报。它集成了完整的攻防工具包:HTTP 拦截代理、浏览器自动化、Shell 执行、自定义漏洞利用运行时等。支持 OWASP Top 10 全部类别,还包括业务逻辑缺陷、API 安全等高级场景。

最实用的功能是它可以集成到 GitHub Actions 中,在每次 Pull Request 时自动运行安全扫描,并生成可直接合并的修复补丁。支持 OpenAI、Anthropic、Google 等多种 LLM 提供商。

https://github.com/usestrix/strix

适合人群:安全工程师、DevSecOps 团队、Bug Bounty 研究员


Chrome DevTools MCP:让 AI 编码代理直接调试你的浏览器

这是 Chrome 官方推出的项目,把 Chrome DevTools 的能力通过 MCP 协议暴露给 AI 编码代理。想象一下:你的 AI 助手不仅能写代码,还能直接打开浏览器检查元素、调试网络请求、分析性能瓶颈——一切都在编码环境中完成。

这个项目标志着浏览器调试工具首次以标准化协议的形式向 AI Agent 开放。对于依赖前端开发的团队来说,这意味着 AI 编码助手可以获得真正的"浏览器视角",不再只是盲目地猜测 DOM 结构。

https://github.com/ChromeDevTools/chrome-devtools-mcp

适合人群:前端开发者、使用 AI 编码助手的团队、Chrome 插件开发者


写在最后

这 7 个项目共同指向了一个清晰的趋势:2026 年的开发者工具正在变得更聪明、更轻量、更尊重用户。省 token 的工具让人少花钱,本地会议助手让人少担心,终端多路复用器让人少切屏,AI 渗透测试让人少加班。

开源社区的魅力就在于此——总有人在你想到问题之前,就已经把解决方案写好了。

参考链接

JuliusBrussee/caveman - GitHub


alibaba/page-agent - GitHub


Zackriya-Solutions/meetily - GitHub


rommapp/romm - GitHub


ogulcancelik/herdr - GitHub


usestrix/strix - GitHub


ChromeDevTools/chrome-devtools-mcp - GitHub

【版权声明】
✨ 本文来自 [张苹果博客] ✨
🌿 你可以:自由转发到社交网络或个人网站。
🌿 你需要:标注作者并附上本文链接(就像给文章留个回家地址~)。

上一篇

评论一下

评论列表

 
等待第一条评论中…
用户头像
小苹果
发布日期:2026年07月05日