比如我使用录音将会议内容录了下来,再将其转成了文字。那么如何将会议中的多人对话内容总结出来呢?这些多人对话内容可能包括提问、肯定回答、否定回答、补充提问、补充回答,最终将内容总结为一段话或者几段话。
我的关注点仅仅在总结这一步,它的核心是筛选出有效信息。
不太想用 LLM ,现在什么都在往 LLM 上套,但是我的直觉是,一定有一些小模型在特定领域表现是更好的,只是我不太了解。如果能很好地达到效果,NLP 也行,越轻量越好,能私有化部署更更更好!
1
gaobh 148 天前
筛选信息,最佳解决方案就是 gpt-4o 。不想用 LLM ?好像没有方案。
|
2
paopjian 148 天前
有没有可能,就是因为这种上下文强关联的语义理解传统小模型做不到,才考试疯狂推大模型的, 等技术突破吧
|
3
mumbler 148 天前
LLM 出来以后,过去所有的 NLP 技术都成为了垃圾,你可以用本地模型处理,7B 就够了
|
4
t41372 148 天前
你可以用小一些的大语言模型,比如最新的 qwen2 听说就不错,很小很轻量,跑量化版本更小,直接私有化部署在本地。或许也可以看看有没有类似的微调可以用。苹果的那个端侧 Apple Intelligence 的总结功能就是用小的大语言模型 + 对应场景加载不同微调实现的。
|
5
bailitusu 148 天前
"但是我的直觉是,一定有一些小模型在特定领域表现是更好的,只是我不太了解"
--- 事实上是,大模型就是可以在大部分领域上碾压传统模型,包括你所需求的对话语义分析 |
6
mortal 148 天前
但你的需求就是语言文字上的,别的领域不用 LLM 可能还能找到更合适的,而语言目前没有更好的。
|
7
EndlessMemory 148 天前
你需求大模型在这方面就是碾压式的存在
|