1
hwdq0012 3 天前 ![]() 视频也是拆成单帧送去推理的,ultraclity yolo 这种不算什么大模型吧,但是能把视频做成结构化数据,再用大模型加工
|
![]() |
2
suke119 3 天前 ![]() Qwen2.5-Omni . 千问的 ai 对话那里点击 有个实时视频对话
[Qwen2.5-Omni 和 minicpm-v 对比]( https://stable-learn.com/zh/qwen-omni-vsminicpm-v/) |