走在开源的路上一发而不可收!继上次开源 UnionLLM 之后,这次我决定将出海业务的核心功能进行开源,未来的商业模式都将在开源项目的基础上构建。
PolyEval 是一个面向 LLM 系统的多语言评估框架。它继承了众多基于大语言模型提示语和算法规则的评估器,原生支持多语言的提示语模版和评估理由,方便接入各种生成和嵌入模型,可以基于 YAML 轻松扩展自己的评估器,它能够帮助生成式 AI 的开发者高效评估自己的应用程序提示语,克服大语言模型生成的不稳定性,打造更好的产品。
项目的地址: https://github.com/EvalsOne/PolyEval
希望得到大家的星标支持,同时也希望大佬们多提建议!🙏