LLM local 模型入门和使用

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

这是一个创建于 70 天前的主题，其中的信息可能已经有所发展或是发生改变。

怎么学习和入手呢

目前就看和使用过 huggingface 上 gpt2 示例。

model 相关的 api 不知道怎么查找，比如像使用 gpt2 的 qa 类任务应该如何来做。

本地能跑起来 gpt2 的示例，换成 llama2 的 7b 模型直接就结束了，是因为集显性能原因跑不起来吗

预训练怎么做，上传语料线上训练还是直接本地训练本地预训练有示例么，简单点的

求教想深入学 ai ，我应该怎么继续下去

10 条回复 • 2025-01-24 17:30:30 +08:00

YsHaNg

70 天前 via iPhone

深入的不太清楚简介强大美观就用 ollama+open webui docker 直接装显存不够大就不用 cuda 之类的 tag cpu 跑推理也还行至少大内存能堆参数量你不在乎延迟后台放着慢慢跑路由器再设置端口转发提供公网服务

Donaldo

70 天前

本地部署：
- 命令行：ollama
- 图形界面：LM Studio

二者都会提供 OpenAI 格式的 API ，另外你参考一下自己的显存大小和模型大小，太大的就会跑不起来或者要借助 CPU ，所以很慢。

hertzry

70 天前 via iPhone

iv8d

70 天前

@YsHaNg 目前只了解到 huggingface 的，仅限于使用了 gpt2. ollama 相比 huggingface 有优势？更好学？

iv8d

70 天前

@Donaldo OpenAI 格式的 API 是什么，我就用过 transformers 这个框架，还有示例用 pipeline 这种方法。

iv8d

70 天前

@hertzry 好终于找到教程了

Donaldo

70 天前

@iv8d #5 我给你解释半天也不如你谷歌搜一下，就是一个 json 请求和响应的格式，一看便知。

YsHaNg

70 天前 via iPhone

@iv8d 针对终端用户包装生态好社区很多应用对应的前端更新很快 https://openwebui.com/ 也有一键 docker run 用 ollama tag 就是前后端数据库一体再加载好模型就能用

iv8d

69 天前

@YsHaNg 这个刚了解到，需要先安装环境，先试试，谢谢

YsHaNg

69 天前

@iv8d 当时搜了一圈对我而言是最容易的哈哈 Linux 机器现成的 docker 前后端打包一起端口设置一下就能到处用了