最好的软件开发AI智能体

成天评科技文化 2024-11-02 22:19:20

OpenHands CodeAct 2.1 取得了最先进的成果:

SWE-Bench 验证的解决率为 53%

SWE-Bench Lite 的解决率为 41.7%

通过函数调用、使用 Anthropic 的 Claude 3.5 模型以及优化目录遍历实现了改进。

0 阅读:0

成天评科技文化

简介:感谢大家的关注