有没有什么模型能很好地分析对话语义的，不要大语言模型

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

这是一个创建于 257 天前的主题，其中的信息可能已经有所发展或是发生改变。

比如我使用录音将会议内容录了下来，再将其转成了文字。那么如何将会议中的多人对话内容总结出来呢？这些多人对话内容可能包括提问、肯定回答、否定回答、补充提问、补充回答，最终将内容总结为一段话或者几段话。

我的关注点仅仅在总结这一步，它的核心是筛选出有效信息。

不太想用 LLM ，现在什么都在往 LLM 上套，但是我的直觉是，一定有一些小模型在特定领域表现是更好的，只是我不太了解。如果能很好地达到效果，NLP 也行，越轻量越好，能私有化部署更更更好！

7 条回复 • 2024-06-21 09:53:09 +08:00

gaobh

257 天前

筛选信息，最佳解决方案就是 gpt-4o 。不想用 LLM ？好像没有方案。

paopjian

257 天前

有没有可能,就是因为这种上下文强关联的语义理解传统小模型做不到,才考试疯狂推大模型的, 等技术突破吧

mumbler

257 天前

LLM 出来以后，过去所有的 NLP 技术都成为了垃圾，你可以用本地模型处理，7B 就够了

t41372

256 天前

你可以用小一些的大语言模型，比如最新的 qwen2 听说就不错，很小很轻量，跑量化版本更小，直接私有化部署在本地。或许也可以看看有没有类似的微调可以用。苹果的那个端侧 Apple Intelligence 的总结功能就是用小的大语言模型 + 对应场景加载不同微调实现的。

bailitusu

256 天前

"但是我的直觉是，一定有一些小模型在特定领域表现是更好的，只是我不太了解"
---
事实上是，大模型就是可以在大部分领域上碾压传统模型，包括你所需求的对话语义分析

mortal

256 天前

但你的需求就是语言文字上的，别的领域不用 LLM 可能还能找到更合适的，而语言目前没有更好的。

EndlessMemory

256 天前

你需求大模型在这方面就是碾压式的存在