业余做的文本大模型训练 Saas 上线 - V2EX

首页注册登录

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

爱意满满的作品展示区。

这是一个创建于 485 天前的主题，其中的信息可能已经有所发展或是发生改变。

众所周知，openai 太强了，以至于现在谈 AI 基本就等同于谈 chatGPT 或 GPT4 ，但是呢，我个人的感情很复杂，一方面我是 chatGPT 的重度用户，也很喜欢 openai ，但是，我依然不希望看到未来是一个只有 openai 的世界

在几个月前我曾经用 chatglm-6b 训练过我自己的数字克隆： https://v2ex.com/t/931521#reply161

此后的开源模型开始井喷，但其质量和 GPT 的差距依然巨大，我开始琢磨，能否通过微调的方式来增加开源通用大模型在某些垂直领域的表现，在尝试的过程中，我意识到，如果不降低训练的门槛，那这个可能性微乎其微，然后我和几个朋友就开始以兼职，远程，业余时间的方式完成了这个低门槛进行文本大模型训练微调的 Saas

这就是模迪手： https://www.modihand.com (好的我也是硅谷的粉丝，我心头的美剧前三

因为这是 V2EX ，所以我想我应该不用再详细说明训练和 embedding 的区别，虽然有很多人说「训练」的时候其实是在说 embedding 和 prompt 工程，但两者本质上就是完全不同的。训练改变了模型的参数，而 embedding 没有，只是从知识库匹配一段文本放到 prompt 里一起给模型。

模迪手简单易用，只需要准备好数据集，在网页上点点点，然后就可以训练了，训练完成后的模型，可以在线调用，也可以直接导出模型文件。

它的一些特点包括：

几乎无门槛实现文本模型训练
支持多种预置基底模型
无需担心算力，环境部署等问题
模型可代部署，支持 API 接口
所有模型均提供完整的导出(可部署在自己的 PC 或显卡服务器上)

当然目前也存在一些问题：

国内访问较慢
部分超参数不支持控制
很多基底模型还没有支持
文档完善度 60%
定价策略比较粗糙

考虑到现在 openai 的强大，这个拥抱开源大模型的项目其实前景很不确定，但我觉得它至少帮我解决了很多问题，我也觉得需要有这么一个东西（我还没有看到类似的）

如果大家有有趣的想法或者有意思的数据集，可以评论或直接通过这个表单填写一下，我们可以提供模迪手的免费算力，让你能够训练出来玩玩看（我之前的一个不算太成功的例子： https://v2ex.com/t/945834#reply18

模迪手： https://www.modihand.com/

23 条回复 • 2023-12-12 15:12:29 +08:00

1

nnccree

2023-11-14 14:58:08 +08:00

为啥网站没有加上英文，面向海外用户？

2

graetdk

OP

2023-11-14 15:01:22 +08:00

@nnccree 刚开始，之后加

3

my6777637

2023-11-14 15:47:31 +08:00

好酷，先 mark ，后面玩玩
训练好后，对外服务的接口会和 openai 的接口保持一致吗？（方便平替）

4

vulgur

2023-11-14 15:47:59 +08:00

Always blue ！

5

graetdk

OP

2023-11-14 15:49:01 +08:00

@my6777637 感谢！我们提供的接口并不建议用于实际业务，仅仅是提供一个测试，后续可能会有更稳定的部署系统，但还是推荐用户训练好模型之后下载，自己部署

6

graetdk

OP

2023-11-14 15:49:32 +08:00

@vulgur 那个我还真想买一个，亚马逊看到要一百多

7

milukun

2023-11-14 15:50:30 +08:00

COOL

8

cijianzy

2023-11-14 15:53:25 +08:00

吼！

9

vulgur

2023-11-14 15:55:09 +08:00

@graetdk 刚搜了一下，Switch Pitch Ball ，淘宝上 35-70 不等，不过都没销量，PDD 上没有

10

nno

2023-11-14 17:21:49 +08:00

微调没啥价值，会严重损坏模型的性能

11

graetdk

OP

2023-11-14 19:39:59 +08:00

@nno 之前的模型微调后丧失某一方面能力的情况比较明显，但现在的模型都好了很多，另一方面如果需要加强的是模型的特定能力，那损失其它（不需要的）泛化能力也不是不能接受

12

czfy

2023-11-14 19:59:57 +08:00

感觉有点看头
我看文档里的训练集举例都是一问一答的知识性对话，如果是像动画里的连续多轮对话数据，也可以作为训练集吗？

13

graetdk

OP

2023-11-14 21:37:16 +08:00

@czfy 可以的，那样数据集做起来会稍微麻烦点

14

titanhw

2023-11-14 22:32:26 +08:00

希望可以加入 qwen-14b 模型，这个模型对比起来效果还是可以的

15

graetdk

OP

2023-11-14 22:56:48 +08:00

16

baka

2023-11-15 00:52:31 +08:00

智谱和百川的模型拿到商业化授权了吗？

17

czfy

2023-11-15 00:56:23 +08:00

@graetdk 可以举个例子吗？

18

graetdk

OP

2023-11-15 09:32:07 +08:00

@baka 虽然拿到了，但是其实我觉得这个不需要商业授权，因为本质上是算力服务，类似于某些云服务器提供模型镜像或者 GUI 给你操作差不多

19

LeoSpeaker

2023-11-15 10:12:55 +08:00

大文本生成模型推荐用哪个模型呢？

20

graetdk

OP

2023-11-15 10:23:14 +08:00

@LeoSpeaker 我个人是 chatGLM 的粉丝，并且目前我觉得 chatGLM3 是比较不错的

21

w9ay

2023-11-15 17:22:43 +08:00

现在是有多少显卡支撑这个网站？

22

LeoSpeaker

2023-11-17 16:13:02 +08:00

@graetdk 还请教您个问题，目前我也在研究了下 chatGLM ，确实很好用，请问您当前的训练是多少显卡呢？

23

Eacls

2023-12-12 15:12:29 +08:00

我也是硅谷的铁粉，Pied Piper 反复的起起伏伏作为同样是创业者来看真的是精彩和刺激，当年的光荣岁月到最后却像是一点痕迹都没有留下过一样。Always blue ~ Always blue !

关于 · 帮助文档 · 博客 · API · FAQ · 实用小工具 · 3529 人在线 最高记录 6679 ·

Select Language

创意工作者们的社区

World is powered by solitude

VERSION: 3.9.8.5 · 22ms · UTC 00:07 · PVG 08:07 · LAX 17:07 · JFK 20:07
Developed with CodeLauncher
♥ Do have faith in what you're doing.