https://github.com/onllama/Onllama.LiteGateway
wget https://git.apad.pro/github.com/onllama/Onllama.LiteGateway/releases/latest/download/Onllama.LiteGateway.linux-x64 -O /usr/bin/Onllama.LiteGateway
wget https://git.apad.pro/raw.githubusercontent.com/onllama/Onllama.LiteGateway/refs/heads/main/[email protected] -O /etc/systemd/system/[email protected]
chmod +x /usr/bin/Onllama.LiteGateway
systemctl enable onllama-litegateway@sk-just-for-example --now
# 请替换 'sk-just-for-example' 为你想要设置的 apikey 。
# curl http://127.0.0.1:22434
同时已支持:
![]() |
1
gzlock 41 天前 ![]() 好一个 onllama...
|
2
YsHaNg 41 天前
ollama 这样的后端不应该只放内网吗 前端暴露公网就好了
|
![]() |
3
musi 41 天前 via iPhone
ollama 也不支持并发,为什么有暴露到公网的想法
|
5
mili100 OP @gzlock 意指站在巨人的肩膀上,或者是羊驼的背上(?
@musi Ollama 从 [v0.1.33]( https://github.com/ollama/ollama/releases/tag/v0.1.33) 开始就已经支持并发和同时加载多个模型了,已经足以能够胜任一些中小规模的生产环境了 |