Show HN: Sweep, Open-weights 1.5B model for next-edit autocomplete
Sweep Next-Edit 代码补全模型总结
该模型是一个1.5B参数的下一编辑补全模型,已量化为Q8_0 GGUF格式。
主要特点:
- 功能描述: Sweep Next-Edit旨在预测开发者接下来要做的代码编辑。
- 性能: 模型可以在笔记本电脑上本地运行,延迟小于500ms(使用投机解码),并在下一编辑基准测试中优于其四倍大小的模型。
- 使用方法:
- 下载
run_model.py和模型文件。 - 使用
pip install llama-cpp-python huggingface_hub安装依赖。 - 运行
python run_model.py启动模型。
- 下载
- 模型细节:
- 格式: GGUF (Q8_0 量化)
- 参数量: 1.5B
- 上下文长度: 8192 tokens
- 基础模型: Qwen2.5-Coder
- 提示格式: 模型使用特定的提示格式,包含文件上下文、最近的diff以及当前状态,用于预测下一个编辑。 具体示例请参考
run_model.py。
相关链接:
- Blog Post: 技术细节和基准测试
- JetBrains Plugin: Sweep AI JetBrains 插件
- HN Thread: 讨论在 VSCode、Neovim 和 Emacs 中的实现
- Twitter Post: 提问
许可证: Apache 2.0