最近看 Open-R1 实现有感

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

这是一个创建于 45 天前的主题，其中的信息可能已经有所发展或是发生改变。

最近在研究 Open-R1 的代码实现，发现它的 reward 运行时是通过 e2b 容器跑的。不过用起来有点麻烦，还得注册 token ，支持的语言也不够多。作为一个懒人，我实在忍不了，干脆自己撸了一个工具，可以自己打包容器运行大模型生成的代码。

为了让用起来更方便，我还顺手写了个 SDK （当然，主要是靠 Cursor 帮忙写的，懂的都懂 😏）。这个工具可以当 code interpreter 用，支持的语言还挺全的，比如：

Python 、JavaScript 、Java 、Kotlin 、C++、Go 、Rust 、Bash 、Objective-C 、Swift 这些常见的都支持。

如果你也在折腾类似的东西，或者需要一个轻量级的代码运行环境，可以试试看：Code-Runner-Sandbox。欢迎来踩坑，顺便给个 star 鼓励一下！ 🙏

第 1 条附言 · 44 天前

目前尚无回复