fishspecial 最近的时间轴更新
fishspecial

fishspecial

V2EX 第 248927 号会员,加入于 2017-08-16 10:37:26 +08:00
fishspecial 最近回复了
2020-08-21 12:48:54 +08:00
回复了 fishspecial 创建的主题 问与答 卑微民警在线求助使用 Python 的 excel 数据分析
@Juszoe 怎么可能嫌弃呢?很欢迎你的帮助!
@inframe 是的,尤其是这次 excel 没有统一的格式,导入数据库正则手机号数据超过了我的技术范围了。
@also24 谢谢你的代码!我今晚下班后试试!
@yzkcy 谢谢你的思路!
@T0m008 侵犯公民信息,主要是股市和房产的。
@Wait845 谢谢不吝赐教!我的小绿 V2ViX1NhbXVyYWk=
@calmzhu 不好意思才回复你,我的小绿 V2ViX1NhbXVyYWk= 白天上班没有时间回复消息。谢谢老乡的帮忙,武汉欢迎你!我一定接待。
@guoyida 我晚上看看这个软件,谢谢!
@huanghaozi 已经卡死了,而且导出的整合 excel 只有文件名和该文件的总行数两列数据
@funcookies 十分需要!晚上我试试其他热心 v 友的代码,运行时间肯定希望尽量在一天以内,时间长了怕电脑崩溃。
@nightv2 好的 我这就去搜一下这篇文章,谢谢!
@dhkjenfbfu 感谢你的专业回答!这些回复我一般不怎么理的。谢谢可爱的 v 友
2020-08-21 00:41:34 +08:00
回复了 fishspecial 创建的主题 问与答 卑微民警在线求助使用 Python 的 excel 数据分析
@binux 谢谢指点!老哥可以点一下相关的操作函数吗?
2020-08-21 00:40:38 +08:00
回复了 fishspecial 创建的主题 问与答 卑微民警在线求助使用 Python 的 excel 数据分析
@waytoshine 谢谢指点!过程我能理解,但是代码上还是觉得困难了点…唉
2020-08-21 00:25:21 +08:00
回复了 1ver 创建的主题 浏览器 Edge 浏览器没有建议密码的功能?
没有,但是接下来几个小版本更新会加上这个功能。
2020-08-21 00:22:48 +08:00
回复了 fishspecial 创建的主题 问与答 卑微民警在线求助使用 Python 的 excel 数据分析
@calmzhu 是的,txt 转为 excel 文件是可行的,但是 excel 无法直接转成文本格式
2020-08-21 00:21:45 +08:00
回复了 fishspecial 创建的主题 问与答 卑微民警在线求助使用 Python 的 excel 数据分析
@EscYezi 应该是爆内存了...可能优化之后能行?我技术实在太菜了 /无奈
2020-08-21 00:20:24 +08:00
回复了 fishspecial 创建的主题 问与答 卑微民警在线求助使用 Python 的 excel 数据分析
@calmzhu 我怕出 memoryerror,而且这么长时间没接触代码了,数据结构和算法都忘的一干二净。今天写了一个很简单的 demo 对相同文件进行去重后,统计所有 excel 的行数,最后算来有一亿多条,这还是跑到 14000 千个文件左右就爆出 memoryerror 的情况之下。实在是数据量太大了。现在就想有 v2 能帮助下,有大概的代码改改我就可以解决问题就好。
2020-08-21 00:17:30 +08:00
回复了 fishspecial 创建的主题 问与答 卑微民警在线求助使用 Python 的 excel 数据分析
@ys0290 我过几个月估计就调回去了。不过这不是在公司跟资本家做事,打击犯罪分子的话,做起来肯定是会当自己的事情去处理的,毕竟也的确是自己的工作任务。(当然自己技术实在有限哈哈哈)
2020-08-21 00:15:17 +08:00
回复了 fishspecial 创建的主题 问与答 卑微民警在线求助使用 Python 的 excel 数据分析
@calmzhu 谢谢你的回答! 19000 左右的 excel 中,因为被多次保存,有些 excel 是一模一样的数据,我就通过计算 excel 的行数来保证没有相同行数的 excel (相同行数的数据不同的 excel 这种情况忽略不计)达成去重的目的。因为不管哪个 excel 文件,每一行数据都会包含手机号,也就是手机号的条数就是 excel 的行数,但是这样就会导致,假如一个手机号在多个文件里出现就引起重复计算,所以的确没想好怎么提取 19000 个 excel 的所有手机号来进行总的去重。一假如可以不花太多功夫,一行中有多个手机号的每个不重复的算一个,但假如太麻烦那就统共算一条吧。毕竟数据量太大了,平均一个文件都有 10000 行左右。
2020-08-21 00:08:36 +08:00
回复了 fishspecial 创建的主题 问与答 卑微民警在线求助使用 Python 的 excel 数据分析
@dji38838c 到时候我也逃不脱的哈哈哈,觉得做这个事情很蠢。
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1385 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 12ms · UTC 17:35 · PVG 01:35 · LAX 09:35 · JFK 12:35
Developed with CodeLauncher
♥ Do have faith in what you're doing.