V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  Morriaty  ›  全部回复第 1 页 / 共 29 页
回复总数  570
1  2  3  4  5  6  7  8  9  10 ... 29  
@Jinnrry 我还真没试过 NGram 和 match_phrase 的组合,直觉上会有很多误召回 badcase ,需要疯狂的调 `slop` 和 `minimum_should_match`🤣,把问题复杂化了,我还是倾向于,直接在需求设计上拒绝这种查询,改为全匹配或者前缀匹配
打错:min_gram:1, max_gram: N
@Jinnrry 楼主提的需求应该是任意长度的匹配,如果用 n-gram 来配置,就要配置 min_gram:1, min_gram: N ,产生的索引量级就是 O(N**2 )。至于 pattern analyzer ,我没有看明白是怎么满足需求的
破案了,必须是新开启的对话
那些说 ES 能搞定的,你们告诉我这种需求,analyzer 要怎么配置?

限制用户查询范围,做前缀、后缀匹配,才是正解
我今天好像不能用了,Your resource has been temporarily blocked because we detected behavior that may violate our content policy.

这里说的 temporarily 不知道是不是真的 temporarily
54 天前
回复了 bantianys 创建的主题 OpenAI 大陆的 Azure openai 终于被彻底封了?
@BenchWidth 请问必须得找代理开通吗,有没有什么网页上传公司资质后自动开通的?我打那个反馈电话打不通,邮件问了也没人回
@GrayXu 试了下 aws bedrock ,没有 Model access ,还得提工单,而且我查了下,好像必须绑定非大陆信用卡才行🤦🏻‍♀️
@hanqian 查了下 openrouter.ai ,蛮不错的,而且直接 Ping 也能 ping 的通。但我不知道它背后的厂商是谁?就是我有点担心这个厂商体量不够,因为我是打算利用 API 进行实际应用开发的,我说的稳定包括服务稳定和法律合规问题
@bobryjosin google 云有大陆可以免代理访问的节点吗
豆包效果上差一些,但用起来方便,我日常就用它练口语。长文本其实 gemini pro 其实效果也不错
试试去考个雅思托福之类的呗,有个目标在,自然而然就往那个目标去了
请问是和豆包一个业务线的,还是只是豆包下的一个 bot agent?
139 天前
回复了 abc0def 创建的主题 旅行 秘鲁印加古道徒步
很棒!

话说看到 Dead Women Pass ,第一反应以为是那个冰冻了几百年祭祀少女的火山口🤣
140 天前
回复了 xqf1126 创建的主题 教育 自学大学 6 到 8 级英语,买什么教材啊
相信我,这种"求攻略"式的问题,小红书比 v 占靠谱🤣
147 天前
回复了 imherer 创建的主题 程序员 ts 里类似 golang 这种写法怎么实现?
你需要比较枚举值吗?不需要的话,直接用 string 定义枚举啊
应该是和 tokenizer 有关,有个不同模型的在线 tokenizer https://huggingface.co/spaces/Xenova/the-tokenizer-playground 你可以测试下
154 天前
回复了 wgfire 创建的主题 创业组队 深圳组队
先介绍下目前积累的项目或者经验啊,看看有无必要深聊,不要就会演变成 2 、30 人的技术吹水群聊
161 天前
回复了 czita 创建的主题 git 依赖的库比较大,提交到 GIT 上吗?
最后的部署方式是啥?如果是 docker ,可以考虑把这些依赖打进 base_image
往西江桥,或者往北真如
1  2  3  4  5  6  7  8  9  10 ... 29  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   862 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 59ms · UTC 21:10 · PVG 05:10 · LAX 13:10 · JFK 16:10
Developed with CodeLauncher
♥ Do have faith in what you're doing.