最近在研究 Open-R1 的代码实现,发现它的 reward 运行时是通过 e2b 容器跑的。不过用起来有点麻烦,还得注册 token ,支持的语言也不够多。作为一个懒人,我实在忍不了,干脆自己撸了一个工具,可以自己打包容器运行大模型生成的代码。
为了让用起来更方便,我还顺手写了个 SDK (当然,主要是靠 Cursor 帮忙写的,懂的都懂 😏)。这个工具可以当 code interpreter 用,支持的语言还挺全的,比如:
如果你也在折腾类似的东西,或者需要一个轻量级的代码运行环境,可以试试看:Code-Runner-Sandbox。欢迎来踩坑,顺便给个 star 鼓励一下! 🙏