AI智能摘要
本文介绍了一个名为“augmented-codebase-indexer”的开源工具,旨在替代ACE,实现本地部署的代码库语义检索。开发者出于对AI IDE(如Cursor)语义检索功能的兴趣,为保障代码隐私和灵活性,开发了此工具。其核心特性是完全本地化,支持通过Docker运行Qdrant向量数据库,并可选择使用硅基流动的免费API或本地部署嵌入与重排序模型。工具提供MCP Server、HTTP API、CLI等多种交互方式。项目目前处于原型阶段,已实现功能闭环,但MCP模式下的性能优化是后续重点。项目地址为GitHub: https://github.com/AperturePlus/augmented-codebase-indexer。
— 此摘要由AI分析文章内容生成,仅供参考。
本文为转载内容,保留原帖观点与结构;如有侵权请联系我处理。
一直对 AI IDE(如 Cursor)背后的 codebase 语义检索功能非常感兴趣。为了能在本地环境中复刻这种体验,同时确保代码隐私和灵活性,我借助 Kiro 开发了这个开源工具。
目前它还是一个原型阶段,但在功能完整性上已经跑通了闭环。虽然在极致性能上可能还无法完全比肩商业产品,但它的核心优势在于完全自主可控。

核心特性
- 完全本地化支持:
- 向量数据库:支持本地 Docker 运行 Qdrant。
- 模型支持:Embedding(嵌入)和 Rerank(重排序)模型既可以使用硅基流动的免费 API,也支持完全本地部署(推荐小参数量模型即可)。
- 多维度的交互方式:
- MCP Server:支持 Model Context Protocol,可直接接入支持 MCP 的 AI 客户端。
- HTTP API:方便集成到其他工具流中。
- CLI & Interactive Shell:提供命令行直接索引/检索,以及交互式 Shell 模式。
- 灵活的向量维度:
- 默认使用 1024 维向量,实测效果平衡。
- 注意:Embedding 模型一旦选定,检索时必须保持一致,不同模型(特别是跨厂商)的向量空间不兼容。

已知问题与路线图
- 性能优化:目前在 MCP 模式下,由于 MCP 的事件循环与 Python 的
ProcessPoolExecutor存在兼容性问题,响应速度稍慢于直接调用。这是接下来的重点优化方向。 - 模型测试:暂时主要测试了 1024 维度的效果,未来会尝试更多维度和模型的 benchmark。

项目地址
GitHub: https://github.com/AperturePlus/augmented-codebase-indexer
开发这个工具确实费了一番功夫,希望能给同样想在本地搭建代码知识库的朋友提供一个选择。欢迎各位大佬试用、提 Issue 或 PR,不论是代码优化还是架构建议,都非常感谢!
Comments NOTHING