1
airyland 2019-12-29 16:50:44 +08:00 via iPhone
百万条和每年增加几十万条,1 万多的访问量,这个量级其实不需要怎么考虑架构,几千万内做好索引数据库都能轻松扛。
|
2
yixiang 2019-12-29 16:52:44 +08:00
这个数据量不需要啥特别优化吧,正常做应该就能支撑。
|
3
wysnylc 2019-12-29 16:57:16 +08:00
应届生都能做,还总包分钱........一人一块?
|
4
jugelizi 2019-12-29 16:57:28 +08:00
想多了 百万条而已
破机器都能扛住 用不着优化 |
5
akira 2019-12-29 17:00:38 +08:00 1
百万条内容随便啥数据库都可以的,不需要啥特别的架构设计什么的
|
6
MarkZuckerberg OP |
7
murmur 2019-12-29 17:19:02 +08:00
百万条内容有索引都不需要特殊优化,要是百万访问还可以聊聊
|
9
MarkZuckerberg OP |
10
vanillaxxx 2019-12-29 21:57:24 +08:00 via iPhone
@MarkZuckerberg 找我啊缺钱啦
|
11
cijianzy 2019-12-29 22:23:46 +08:00
看作者 id 就觉得作者应该挺有前途的。
|
12
areless 2019-12-29 22:47:04 +08:00 via Android
我 x,楼上的一个个都在搞笑啊。这个项目不使用 sphinx,lucene 这种外部索引必挂。而且 100 万本书全部建立索引,文件很大很大很大很大很大~~~你先建把 100 万本书的索引建出来试试吧。最关键点是--设计出让甲方满意的搜索结果~~~现在通用的分词系统不能达到甲方要求怎么办?你自己去搞分词系统吗?
|
13
find 2019-12-29 22:51:32 +08:00 via iPhone
可以找我啊,专搞搜索 好多年了
|
14
agdhole 2019-12-29 23:09:49 +08:00
需要索引文档内容吗?如果不要确实不复杂
|
15
yufeng0681 2019-12-29 23:22:11 +08:00
Redis 缓存可以不急着上,ES 搜索引擎要上;
用户发起的都是模糊搜索,可能是多个关键字搜索,数据库十万级别以上的模糊搜索,响应无法满足要求; 只能把你支持的几个字段的值,存到 ES 里面, 列表展现搜索结果,并显示部分摘要信息; 详情页则是唯一索引条到具体某个文档,唯一索引能保证性能; |
16
b7cn 2019-12-30 02:23:43 +08:00
自己建立索引 跑的话 并发大 可能会搜索速度比较慢,
我之前解决网站问题的时候 找到了以下几个 API 比较方便的解决这个问题 你可以看看。 https://cloud.tencent.com/product/tcs https://www.aliyun.com/product/opensearch?spm=5176.8006371 https://data.aliyun.com/product/elasticsearch?spm=5176.8006371 |
17
MarkZuckerberg OP |
18
MarkZuckerberg OP @agdhole 不需要搜索索引文档内容。只需要搜索对应 id 的题目、作者、期刊、等信息。
可以参考:Google Scholar 和百度学术的功能。 |