V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  glacer  ›  全部回复第 5 页 / 共 14 页
回复总数  267
1  2  3  4  5  6  7  8  9  10 ... 14  
2019-03-14 20:08:51 +08:00
回复了 JCZ2MkKb5S8ZX9pq 创建的主题 程序员 怎么找出近似的汉字?
能否拿到汉字的像素值?比如在 8x8 的矩阵中,空白点像素为 0,笔画点像素为 1,得到一个 64 位的向量。然后通过一些相似度算法计算即可。
2019-02-21 10:34:32 +08:00
回复了 iyaozhen 创建的主题 MySQL MySQL 如何按天动态表分区?
分区键应该设计成 date 的整数类型,如 20190221。一次性创建几年的分区,可以保证自己在职期间不需要在操作增加分区...
两个问题:
1. 不太想得通为什么数据量大的情况下会使得增加分区卡死,MySQL 的分区表也是一个独立的物理表,和其他分区应该是没有关系的。也许是自己没有经历过这个数据量级的操作吧。
2. 楼主说删除数据需要 3 个小时以上,但是下面又说直接删除分区数据很快。那么之前楼主删除数据是直接使用 delete 删除的?这样删除大量数据不仅慢,还无法释放原数据占用的硬盘空间。必须在执行`optimize table`语句后才能释放。
2019-01-23 10:25:58 +08:00
回复了 sl0000 创建的主题 C C++ class 数据对齐优化的问题?
楼主是 32 位机器?
2019-01-22 00:11:11 +08:00
回复了 Counter 创建的主题 程序员 多线程小问题求教
不对吧,就算没有第二个线程把 a = -1,a 在为 2 的时候变成 0,下一个循环的时候不还是执行代码 1 吗?
2019-01-19 10:59:24 +08:00
回复了 victor97 创建的主题 程序员 什么是真正的程序员
这个翻译有点硬
2019-01-15 11:47:53 +08:00
回复了 Mac 创建的主题 MySQL 是不是只要 group by 就必定 using temp?
using temp 通常只是为了排序,如果在 group by 的时候数据已经排序,那么就不需要 using temp。所以看你的索引是否能在 group by 被使用到。
2019-01-15 11:23:41 +08:00
回复了 hirasawayui 创建的主题 问与答 收藏收藏,真的是藏到角落里了.
马来人无疑了
2019-01-11 10:25:26 +08:00
回复了 yqsas 创建的主题 问与答 大家如何看待外星信号事件?
@lance6716 那是对于已接近光速运动的人来说是这样的,15 亿光年的距离可能几个小时就跑完了。但对于外部观察的人来说还是过了 15 亿年。
2019-01-09 20:37:27 +08:00
回复了 yexm0 创建的主题 全球工单系统 用谷歌搜 12360 有惊喜
楼主说的惊喜是这个?
2019-01-09 20:36:42 +08:00
回复了 yexm0 创建的主题 全球工单系统 用谷歌搜 12360 有惊喜
中国铁路 12306
https://www.12306.cn/
吐尔洪·艾山 652923********0312: 梁红英 360602********0544: 张义强 532129********3513: 乐以福 362323********0511: 姚勇 360502********5658: 白建林 ...
2019-01-09 20:00:12 +08:00
回复了 Asan 创建的主题 程序员 大数据量 join 操作
楼主的性能吃紧在 IO,每次都返回 100w 行 100+字段的数据,这能不慢吗
2019-01-09 14:29:09 +08:00
回复了 Martin9 创建的主题 Docker 请教一个 docker 的问题
进入 docker 内 curl 8080 端口正常吗
《重构》中的建议是,不要在项目初期就进行过多的设计,重构应该是在项目开发的过程中同步进行。一旦察觉出有代码的问题就应该立即进行优化,而不是堆积起来后再重构。
首先「两亿数据的 table 做关联查询可能会崩掉 mysql 」是必现?是楼主复现过还是「据说」?
2019-01-07 11:05:33 +08:00
回复了 Coder1991 创建的主题 职场话题 得了这个病,怎么继续做程序员?
一小时上一次厕所... 我有时候喝水喝多了一小时得上两次。
2019-01-02 15:53:13 +08:00
回复了 scalaer 创建的主题 程序员 有 sql 库/模版 吗?
简单的:正则;
复杂通用的:AST
2018-12-28 16:40:45 +08:00
回复了 boom7 创建的主题 程序员 求大佬指点,毕业一年的爬虫的职业发展
楼主你和我两年前几乎一模一样。
我也是毕业后进入某厂做爬虫,做了一年多后跳槽做了后端。做爬虫期间也做了不少破解工作,像验证码,js 加密破解,APP 的逆向等。
当时做久了觉得这份工作很无聊,平时的工作基本都是在做爬虫的修修补补,应对对方的反爬虫策略。业绩上我们基本都是背锅侠,一旦数据出了问题我们要第一时间顶上,数据没问题的时候就是理所应当。不过现在回想起来其实并不是那么无聊。很多人觉得写爬虫没有一点技术含量,没错,写一个爬虫确实很简单,但写一个「优雅」的爬虫却并不简单。一个靠浏览器模拟爬取的爬虫怎么能喝一个通过破解加密直接请求 API 的爬虫比呢?我在那一年的爬虫工作中最大的收获并不是写爬虫这个技能,而是在爬数据的过程中额外接触到的多个层面的知识。像 HTTP 协议,JavaScript,图像处理,机器学习,逆向等等,以及一些爬虫架构和服务,像去重、调度分发、断点续爬、分布式、缓存、数据库等,还有与其他数据上下游的合作中熟悉的整个数据处理流程和一些大数据的知识。这些基本都是在那一年的爬虫工作中获取到的知识,也是我现在能转型后端的一个原因。这份工作给我带来的不是某个专精的技能,而是拓宽的知识面。
在目前的大环境下,我还是不建议主业做爬虫,前景不是很明朗(合法性)。楼主可以多利用业余时间学一些感兴趣的方向转型,多去试试总会成功的。
1  2  3  4  5  6  7  8  9  10 ... 14  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5856 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 38ms · UTC 01:58 · PVG 09:58 · LAX 17:58 · JFK 20:58
Developed with CodeLauncher
♥ Do have faith in what you're doing.