V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  KalaSearch  ›  全部回复第 3 页 / 共 12 页
回复总数  224
1  2  3  4  5  6  7  8  9  10 ... 12  
2020-08-28 00:35:15 +08:00
回复了 ZacharyL 创建的主题 职场话题 offer 求意见。。
说说你看重些什么(加不加班,待遇还是多点闲暇时间,喜欢的城市之类)这样其它同学好给你意见
2020-08-28 00:33:04 +08:00
回复了 wzw 创建的主题 问与答 轻量级的全文检索选哪个? 50 万内。
如果是商用,有预算可支付,面向国外用户考虑 Algolia,接 API 或者直接用 SDK 就行,Python Go etc 都有
如果同样是商用且有预算,面向国内用户,考虑卡拉搜索,接 API 或者直接用 SDK 就行,目前有 Python 和 JS 的 SDK

如果就是学习用,考虑深入研究下 Lucene 和 Elastic Search

你的开线程像 API 一样提供服务,事实上就是个穷人版的 ES :D

另外不推荐 Whoosh,已经不太活跃了
2020-08-28 00:27:24 +08:00
回复了 veike 创建的主题 自然语言处理 V 站的中分分词怎么能做到如此之快的
好久的贴,顺手答一波

词库加载速度和分词速度应该分开来算,词库一般加载后就 singleton 一直用了。单个分词速度可以试试不同分词器来算一下。

如果分词的作用是做搜索的话,我会建议

1. 不要把分词搞太复杂,需要高精度分词才能达到优秀结果的搜索引擎体验不会好
2. 主要把工作在索引的时候做完

如果感觉分词头疼,就是需要个搜索引擎用,也懒得维护个 ES 之类,可以考虑我们做的卡拉搜索
2020-08-28 00:23:58 +08:00
回复了 geekjc 创建的主题 分享发现 独立开发者头条拍个视频一天挣了近 400,什么体验
恭喜!

我想问下持续产出高质量视频困难吗?之前一个知名的 youtuber 叫阿福,火了一阵以后差点抑郁,因为持续产出高质量的内容太费心力了,所以后来转了 vlog
2020-08-27 13:18:08 +08:00
回复了 Pengxiguaa 创建的主题 数据库 [求助] 关于 elasticSearch 中文分词插件 IK 分词机制的疑问
CJK 语言做查询的时候如果非常在乎召回的话,ngram 也是可以考虑的(类似你这写的:我,我想...)

如果索引本身没那么大的话,对中文分词来说 N 取个 10 就完全够了,这样索引大小最多也就是 10 倍。目前 SSD 这么便宜的状况下问题不大

当然如果实在索引大小有限制(边缘计算、嵌入之类情景,或者数据真的太大)那可以像一楼说的自定义一些词库。

如果是以学习为目的的话推荐读: https://github.com/ysc/cws_evaluation

如果是在做项目需要搜索的话,且不想折腾的话,自荐下我们做的卡拉搜索 kalasearch.com 不用自己搞分词之类,全托管了。作为工程师的你时间很宝贵,应该用来学习或者解决业务问题,搜索可以交给我们 :)
2020-08-26 02:30:07 +08:00
回复了 tomsun28 创建的主题 程序员 开源项目尝试推广的第一天,有点失落。
@tomsun28 客气了,不是大佬

能加个微信吗?微信号就是我 id,交个朋友
2020-08-26 00:23:03 +08:00
回复了 tomsun28 创建的主题 程序员 开源项目尝试推广的第一天,有点失落。
读了下很不错,是我们需要的。

LZ 考虑放个接受捐赠的链接吗?

另外给两个小建议,楼主酌情

1. spring 的群体比较大,我觉得你可以着重往 spring 走,介绍里多写点关于在 spring 项目中怎么用的例子。Tag 里只有一个 spring security
2. 考虑写一些教程发到简书,不一定是直接用你这个方案的文章,就 general 地教大家用户鉴权之类
2020-08-26 00:16:39 +08:00
回复了 KalaSearch 创建的主题 程序员 也没融钱,就俩程序员自己搞, 12 个月从 0 到 700 万
@willmok +10086


@o00o 也不要觉得国外环境就是天堂,抄起来也顺手得很,只是不太有人拷你的 css 文件之类的事情发生就是了


@www5070504 这是 VC 问的蠢问题


@waylybaye 应该是有


@DemonQ


@dxgfalcongbit 666


@xiaomingVTEX 是的,面包多之类的真的就不错。能再提几个吗?我想写一下


@way2explore2 感谢,偶尔置顶,会有很多回复


@Kirsk 是的


@ddeef 加油


@maxxfire so what? 文章给一万多个读者提供价值了么?

@evilStart 感谢关注。你不在我们的内测用户列表里吧?他们说不算 beta 才不算 beta :)
2020-08-25 15:11:34 +08:00
回复了 KalaSearch 创建的主题 程序员 也没融钱,就俩程序员自己搞, 12 个月从 0 到 700 万
@kop1989 是的,分析很到位


@leven87 和国内国外没关系,有没有提供够价值让用户付费才是关键


@zhanwen 不是,我并不知道你在说什么


@OneMan 感谢。已经习惯了忽略类似的回复
2020-08-25 14:14:05 +08:00
回复了 KalaSearch 创建的主题 程序员 也没融钱,就俩程序员自己搞, 12 个月从 0 到 700 万
@geekjc 加油

@frittle 感谢关注和喜欢~也差不多吧,很后面招了俩帮手


@across :D

@back0893 是的,要抓准群体
2020-08-25 12:10:51 +08:00
回复了 KalaSearch 创建的主题 程序员 也没融钱,就俩程序员自己搞, 12 个月从 0 到 700 万
@CharmanderS5 T_T 握爪
2020-08-25 10:50:21 +08:00
回复了 KalaSearch 创建的主题 程序员 也没融钱,就俩程序员自己搞, 12 个月从 0 到 700 万
@SingeeKing 抱歉,的确是漏了,加上了还在部署



@Morriaty 你是指卡拉搜索吗? value prop 还在打磨
2020-08-25 09:45:29 +08:00
回复了 KalaSearch 创建的主题 程序员 也没融钱,就俩程序员自己搞, 12 个月从 0 到 700 万
@Libby520 soga


@zlkent :D content marketing 也好,干货也罢,只要内容能打动人对人有帮助就好。( p.s. 小声说我感觉只要没其它忧虑的话一辈子程序员挺好哈哈)


@Yano 多看看公司里买了多少服务


@keepeye 没错
2020-08-25 09:29:05 +08:00
回复了 KalaSearch 创建的主题 程序员 也没融钱,就俩程序员自己搞, 12 个月从 0 到 700 万
@bt7vip 你提这个非常有意思。是的,这样轻的工具是有个 retention 的问题,竞争强的话不好做。但也正是因为这样,才有小团队、个人开发者、小公司的机会,如果全部是护城河深深的产品,那也进不去了


@iConnect 是的,但不一定说要做在什么媒介上( app 还是网站)。经验数据上,美国 SaaS 公司的营收,比如 100 万美元,差不多等同换过来 100 万人民币,就是同样级别在国内能做到的营收



@ofooo 。。。链接那么大了还看不见呐,在文尾


@coldmonkeybit 文章末尾有,有找到吗


@wzw 不光是说做东西出来,你细读下原文,marketing 下了非常大的力气的

@leo108 感谢,译这样的文章还是很花力气的,感谢肯定
2020-08-25 09:25:44 +08:00
回复了 KalaSearch 创建的主题 程序员 也没融钱,就俩程序员自己搞, 12 个月从 0 到 700 万
@Libby520 打不开了? 404 吗?能否关缓存刷新试一下
2020-08-25 08:32:35 +08:00
回复了 KalaSearch 创建的主题 程序员 也没融钱,就俩程序员自己搞, 12 个月从 0 到 700 万
@wisunny 哈哈哈哈今日最佳。不过是“他俩”
2020-08-25 08:25:52 +08:00
回复了 KalaSearch 创建的主题 程序员 也没融钱,就俩程序员自己搞, 12 个月从 0 到 700 万
@xppppsfg 好问题。他们的目标客户多数上传的是较短的视频,十分钟以内的,看他们的定价其实也可以看出来


@ffLoveJava 我显然不知道,但你可以问下他们现在几万个付费用户为啥信任 :D
2020-08-25 08:15:51 +08:00
回复了 KalaSearch 创建的主题 程序员 也没融钱,就俩程序员自己搞, 12 个月从 0 到 700 万
@laminux29 当然存在,你个人用是一说,但如果你是公司用用盗版 Adobe 试一试

@MaiKuraki 中国其实也可以,很多小垂直领域都有小团队做得很不错了。感兴趣的话我之后写些国内的例子。p.s. 仓木麻衣粉?
2020-08-25 07:58:10 +08:00
回复了 KalaSearch 创建的主题 程序员 也没融钱,就俩程序员自己搞, 12 个月从 0 到 700 万
@murmur 哈哈,你这个角度有趣。名字可能很重要,不过 to B 的生意,单靠一个好名字无法催人付钱

爱剪辑之类都是上个世代的软件了,如果能做到 web 里的话,可扩展市场可能大 10 倍不止
2020-08-24 10:51:42 +08:00
回复了 chaos93 创建的主题 问与答 [不懂就问] 请问想做一个监控服务,怎么弄呢
Prometheus + Grafana 可以吗?

https://v2ex.com/t/697832
1  2  3  4  5  6  7  8  9  10 ... 12  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1430 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 77ms · UTC 16:47 · PVG 00:47 · LAX 08:47 · JFK 11:47
Developed with CodeLauncher
♥ Do have faith in what you're doing.