大模型能记住所有它训练过的数据吗? lurui45 • 8 小时 14 分钟前 • 最后回复来自 julyclyde | 6 |
如何从头构建一个自己的大模型呢?从底层最基础的神经网络开始实现 lenqu • 11 天前 • 最后回复来自 me007 | 8 |
LLM 静态批处理和 Continuous Batch 相关疑问的求解 huc2 • 11 天前 • 最后回复来自 bug2018 | 7 |
有没有久坐提醒类服务,最好是基于啥啥啥模型的那种活体检测。 YaD2x • 15 天前 • 最后回复来自 cutecore | 13 |
LLMs 文本标签(分类)任务怎么做比较好? CNYoki • 17 天前 • 最后回复来自 mumbler | 5 |
能推荐个偏实战的 tranformer/LLM 的课程么? ttgo • 16 天前 • 最后回复来自 TimePPT | 3 |
深度学习在自己电脑上跑, Linux 环境,选择 WSL 还是物理机 Ubuntu? jiashuaibei • 25 天前 • 最后回复来自 jiashuaibei | 12 |
CUDA 搞深度学习, 1TB 的一块硬盘, C 盘留多大合适? jiashuaibei • 24 天前 • 最后回复来自 Kazetachinu | 26 |
怎么理解 RNN 循环神经网络工作原理? James369 • 25 天前 • 最后回复来自 James369 | 12 |
ReLU 函数在 x> 0 的时候也是线性的,套 ReLU 函数是怎么实现激活作用的? lisisi • 31 天前 • 最后回复来自 sanebow | 4 |
阿里新开源的 QwQ-32B-Preview 模型有啥特殊性? cowcomic • 56 天前 • 最后回复来自 cowcomic | 4 |
上楼梯的时候,人是怎么判断脚该抬多高的 abcfreedom • 58 天前 • 最后回复来自 8355 | 47 |
小白求教,输入语音指令输出统计图表这样的功能是否可以实现? jiangziheng • 64 天前 • 最后回复来自 mazyi | 1 |
狗东 cfe 滑块验证码轨迹模拟 KingZZZZ • 97 天前 • 最后回复来自 naythefirst01 | 1 |
能分享一下研究大模型微调的技术论坛和站点吗? nyxsonsleep • 99 天前 • 最后回复来自 nyxsonsleep | 2 |
有没有针对机器学习“图片训练集”的管理软件? andforce • 107 天前 • 最后回复来自 jeremyl313 | 2 |
[请教][内存问题]Flux 部署 liu731 • 122 天前 |
有深度学习交流群吗?没有我拉一个 Chihiro316 • 140 天前 |