V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  KalaSearch  ›  全部回复第 2 页 / 共 12 页
回复总数  224
1  2  3  4  5  6  7  8  9  10 ... 12  
2020-09-16 23:35:14 +08:00
回复了 shihty5 创建的主题 Java 你们公司现在在用 Java 什么版本呢?
java 11
2020-09-06 15:56:31 +08:00
回复了 codingAlex 创建的主题 投资 2020 年过去三分之二了,你们的股票(基金)收益怎么样了?
20% 左右

但是都是浮云,前几天曝出来软银这段时间大量买入美股,部分造成美股狂飙。WSJ 周五报了,市场还没来得及消化,估计周一还会回撤一波
2020-09-05 16:00:49 +08:00
回复了 leihongjiang 创建的主题 程序员 百度 AI 的 自然语言处理 中文分词有 api 吗?
如果分词是准备做搜索的话,自卖下自瓜,推荐我们做的卡拉搜索 :D
2020-09-05 16:00:32 +08:00
回复了 daimubai 创建的主题 生活 大家平常都是怎么输出身体负能量的?
跑步
2020-09-05 16:00:07 +08:00
回复了 oahebky 创建的主题 问与答 国内的 AI 电话是国内开发的还是买国外的?
这个应该是做得出来的
2020-09-05 15:59:19 +08:00
回复了 netty 创建的主题 Blogger WordPress 个人博客搭建初成,欢迎拍砖
欢迎入坑

下一个坑考虑下 gatsby :D

https://v2ex.com/t/698807#reply82
2020-09-05 15:57:26 +08:00
回复了 leihongjiang 创建的主题 程序员 百度 AI 的 自然语言处理 中文分词有 api 吗?
2020-09-05 15:56:24 +08:00
回复了 proofreading 创建的主题 自然语言处理 中文分词在线接口 API 需求调查
我觉得切词 API 的需求应该还是大的,主要是极多情况下大家的主要业务也不是分词本身,所以一味追求分词准确度没有意义,还不如用一个效果“合理”的 API

合理的定义当然非常主观,但对多数人来说,分词的作用就是做搜索。我们的经验中,要把分词琢磨清楚再把搜索琢磨清楚还是很不容易的。

ES 有不少分词用的插件,但要比较各种分词的效果(索引分词效果和搜索分词效果)会需要比较多的上下文知识。通常 Analyzer 和 Query analyzer 必须用同样的分词器,但也会造成有的时候某个词就是搜不出来的情况。

所以如果是做搜索,且预算允许的话,自荐下我们做的卡拉搜索,啥也不用配置,接上 API 瞬间开搜,后台直接控制排序算法也很方便(灵感来自于 Algolia,算是个跟 ES 很不一样的独创吧)。

速度在我们的 benchmark 上比优化过的 ES 还快 10 倍左右,欢迎试用
2020-09-05 15:50:47 +08:00
回复了 zjsxwc 创建的主题 程序员 mysql 能不能对中文分词检索?
MySQL 和 PG 本身都支持全文索引和分词,分词的方式有直接切 ngram (N 可选,索引会大 N 倍)或者用一些分词的插件。但问题是 MySQL 和 PG 都不是设计用来做搜索的,因此非要强用会比较拧巴。

而 ES 有不少分词用的插件,比较各种分词的效果(索引分词效果和搜索分词效果)会需要比较多的上下文知识。通常 Analyzer 和 Query analyzer 必须用同样的分词器,但也会造成有的时候某个词就是搜不出来的情况。

预算允许的话,自荐下我们做的卡拉搜索,啥也不用配置,接上 API 瞬间开搜。速度在我们的 benchmark 上比优化过的 ES 还快 10 倍左右
2020-09-03 02:20:05 +08:00
回复了 baobao1270 创建的主题 数据库 MariaDB 基金会居然入驻 B 站了
社区也需要在国内发展呀,中国的用户群很大
2020-09-03 02:19:43 +08:00
回复了 philsky28 创建的主题 数据库 mac 上有哪些免费的可以使用 http 隧道的数据库软件呢
命令行就可以?
@hyperbin 是的
点子很不错

技术相关的英文词库其实不大,常见的 async, all, access 之类全翻了好像显得有点乱
2020-09-02 03:38:52 +08:00
回复了 Livid 创建的主题 精灵宝可梦 V2EX 对 Nintendo Friend Code 的进一步支持
哈哈哈好玩
@hyperbin MySQL 也有使用场景,从可替代性上说倒确实可以多用 pg
@j0hnj 译文原文加在了文章底部


@wdhwg001 你见过这种质量的洗稿吗


@chinvo 你可能要仔细读读我和一楼同学对话的上下文吧

@shc 好建议,可加
@sxfscool T_T 容我慢慢来写

写文章也需要充电,比如 ES 系列的正在看代码,现在的进度是看十个小时的内容,能写 10 分钟的阅读内容。理解万岁 :D
2020-08-31 02:38:31 +08:00
回复了 KalaSearch 创建的主题 程序员 如何用 Gatsby 打造你的完美博客 - 初始设置秒开和一键部署
@lookas2001 楼主的文章都是干货满满,都读一遍也不亏 XD
@dilu 尝试下面包多?
1  2  3  4  5  6  7  8  9  10 ... 12  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1383 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 28ms · UTC 16:51 · PVG 00:51 · LAX 08:51 · JFK 11:51
Developed with CodeLauncher
♥ Do have faith in what you're doing.