如何挑选一款合适的手机用于开发呢?
如何让你写的爬虫速度像坐火箭一样快 [并发请求]
APP 逆向神器之 Frida [ Android 初级篇]
当你写爬虫遇到 APP 的请求有加密参数时该怎么办? [初级篇-常规模式]
当你写爬虫遇到 APP 的请求有加密参数时该怎么办? [初级篇-秒杀模式]
当你写爬虫抓不到 APP 请求包的时候该怎么办? [初级篇]
当你写爬虫抓不到 APP 请求包的时候该怎么办? [中级篇]
当你写爬虫抓不到 APP 请求包的时候该怎么办? [高级篇-混淆导致通用 Hook 工具失效]
5G 的到来会对爬虫产生怎样的影响?
当你写爬虫时遇上 Flash+加密的解决方式
听说这个爬虫面试题很难?看完你就知道怎么做了
觉得文章质量不错的朋友可以关注一下我的公众号或知乎专栏,公众号二维码在此:
1
whwq2012 2019-08-13 14:56:55 +08:00 via Android 7
我还以为是维权,没想到是营销。。。
|
4
Mac 2019-08-13 15:01:04 +08:00
很正常啊,点举报啊。油管也不反对同一个视频传两遍啊,例如同一个搞笑视频,谁知道谁原创的呢
|
6
dji38838c 2019-08-13 15:02:19 +08:00
审核员不是只有一个人,即便只有一个人,也不可能记得所有审核过的视频。
何况审核员的主要精力,是用在敏感内容的审核,敏感内容那么多,就已经很辛苦了 |
7
DrPikaduo 2019-08-13 15:13:06 +08:00
前两天下雨,然后很快又放晴了,中午准备去上班,路上碰到一个 b 站的客服老哥,跟他聊了下,吐槽了一下审核和客服,现在好像是基本上所有的审核和客服都放在了武汉这个分公司,可能是成本低一些吧,人很多,工作压力也很大,武汉这地方大家也知道,工资低物价高,换位思考了一下,唉,大家都不容易
|
8
locoz OP @dji38838c #6 机器记得就行了,为什么要人记得呢?数据库里查个重就解决的事情。敏感内容其实也是,同样有鉴黄 AI 可以辅助审核员工作,说白了就是没想着那么搞而已。
|
9
locoz OP @DrPikaduo #7 所以要 B 站优化以下审核这里的流程啊,比如在人工审核前,加一个查重的步骤,分个词、分析一下相似度再给审核员,就解决了啊。
|
11
DrPikaduo 2019-08-13 15:19:03 +08:00
@locoz 昨天还是今天看到一个 b 站的招聘贴,招算法优化,估计也是意识到自己的推荐算法做的跟鬼一样吧,b 站扩张太快,用户增长也快,步子大了扯到蛋了
|
13
locoz OP @DrPikaduo #11 推荐算法我觉得其实还好吧,偶尔会推荐出来一些之前没见过的小 UP 主,挺有意思的。比淘宝那种要好得多,淘宝是在你买了一个什么东西以后就天天发推送给你推同样的东西,然而那东西你买都买完了。
|
14
dot2017 2019-08-13 15:23:14 +08:00
标题党 :(
|
16
loginbygoogle 2019-08-13 15:45:49 +08:00 via Android
卑微的自媒体
|
17
locoz OP @loginbygoogle #16 请你先看内容再发表言论谢谢,内容都没看、见到外链就开喷真没意思。
另外,为原创作者们揪出侵权者并举报、发声,这件事情我并不觉得有多卑微。 |
18
incheon 2019-08-13 15:59:15 +08:00
推荐公众号吗
|
20
Bonky 2019-08-13 16:01:52 +08:00 via iPhone 2
顶楼主,我都看完了...现在的人看见公众号就以为是自媒体,疯狂 diss。不知道 v 站这种鄙视链是怎么来的
|
22
f056917 2019-08-13 16:07:35 +08:00
夹带私货而已嘛,算什么营销算什么推广(狗头)
|
23
locoz OP @f056917 #21 私货在哪呢?指出来看看?我一不收税、二不卖课、三不水文,连二维码和专栏链接我都放到最下面去了,进来就一个大链接跳正文,还要怎样?
|
24
SEARCHINGFREE 2019-08-13 16:19:22 +08:00 1
太长了,貌似是机器号搬运原创视频。
(这是条创富思路,趁着逼站还没解决赶紧捞一波 |
25
loginbygoogle 2019-08-13 16:22:51 +08:00
@locoz 我确实没看内容,我是看了你最近发的贴子才得出的结论。
|
26
locoz OP @SEARCHINGFREE #23 是的,机器号搬运原创视频,但这不是关键,关键是站内 UP 自己在 YouTube 投的同样的视频都能被搬回来二次上传,并且能审核通过。
|
27
MonoLogueChi 2019-08-13 16:35:36 +08:00 via Android
你那个历史文章也太秀了吧,不被别人看成是营销才怪呢
|
28
locoz OP @MonoLogueChi #25 啥?不是都是干货吗...我就没见几个爬虫文章有这么干的
|
29
MonoLogueChi 2019-08-13 16:44:28 +08:00
@locoz #28 你发帖,想说的内容占了一行,你的历史文章占了十几行。知道你的初心是好的,但是你也是为了用这件事为自己吸粉
|
30
locoz OP @MonoLogueChi #25 龟龟,文章超链接怎么还没了
|
31
locoz OP @MonoLogueChi #27 没有历史文章可能某些人会更加觉得是营销号吧...我觉得有历史文章在这至少还能让别人心里有点数,能看得出跟那些天天转发、发水文营销号有区别
|
32
cutlove 2019-08-13 17:09:23 +08:00
传统艺能而已,大惊小怪
|
34
skiy 2019-08-13 17:26:15 +08:00
审核只审核是否违法( Z.F 要求的那些)。
|
35
locoz OP @skiy #32 参见第二条附言以及投稿前会提示的用户协议,审核是有义务也有权力驳回这种稿件的:
bilibili “十一不准”原则 http://member.bilibili.com/studio/creative-treaty/q0 哔哩哔哩创作公约 http://member.bilibili.com/studio/creative-treaty/q2 |
38
ochatokori 2019-08-13 17:52:22 +08:00 via Android
营销号太多
狼来了 |
39
locoz OP @ochatokori #36 哎
|
40
skiy 2019-08-13 19:16:24 +08:00
@locoz 我不是指定了条件了吗?(违法的,ZF 要求禁止的)
你见过有几个公司认真执行“协议条款”的,就算执行,也肯定是执行对他们自己有利的。这条款是他们自己定制的。条款上面有的,他们可以放过,也可以不放过。当出事时,他们就以条款来进行处理。这种事情还少么?企业都这样,不侵犯他们的利益,他们是不会做的。 |
41
vacua 2019-08-13 19:34:31 +08:00 via Android
噗嗤,这玩意有啥查重程序吗?怎么去检测唯一性?稿件名还是视频文件 md5 ?(滑稽)不会是查看视频帧数重复率吧?
|
42
vacua 2019-08-13 19:43:36 +08:00 via Android
再多说一点吧,你文章里面所说的搬运了**B 站 UP 主在 YouTub ”**的视频,那么如何确定这个 UP 主在有 YouTube 和 B 站是同一个人呢?简单地通过两个网站的用户名吗?
|
43
CEBBCAT 2019-08-13 19:55:09 +08:00 via Android
二维码都带上了……
|
44
realpg 2019-08-14 08:56:21 +08:00 via Android
维权都不忘推广
营销号警告 |
45
locoz OP @skiy #38 那按你这么说的话,B 站做大了之后的视频审核严格度和水平反而倒退了一些咯?要知道以前在 B 站投视频,只要存在重复的视频都会被退回稿件(比如同一个系列搬运不能由多个人投递,只有在原投递者失踪的时候才允许用补档的形式投递),机器搬运已经存在很久了,多平台投视频的也存在很久了。
|
46
locoz OP |
47
locoz OP @vacua #39 首先明确一下场景,我说的是:机器搬运搬出了 [已在站内有账号的 UP 主] 所发的视频 依然被审核通过的问题。
在这个场景下,查重这个事情非常简单,甚至可以说落智,因为只需要打开引用视频的链接->搜一下站内对应的视频->搜一下站内对应的 UP 主,就已经可以知道存不存在侵权问题了。 而这个操作,对于 B 站来说几乎是 0 成本的,因为人工操作这个步骤很麻烦还可以由机器来辅助操作,平均每个视频投递后只需要不到 3 秒的时间就能完成自动查重的步骤,占用资源也微乎其微,直接的机器判断不准的话还有着审核人员人肉判断,不存在误伤。 然后如果你要说到更深的问题,就是洗稿,对视频做了一些模糊水印、截边之类的加工,并且重写标题再投递,这种就根本不属于我前面所说的场景了。当然这也存在解决方案,比如阿里云的视频 DNA: https://ai.aliyun.com/vi/dna,当然成本肯定很高,对于一个商业公司而言并不一定值得去做。 |
48
skiy 2019-08-14 10:05:29 +08:00
@locoz
我并没有说你说的有问题。 我的意思是说,监管的是他们自己,他们自己出的隐私协议。 他们审核的肯定是以 ZF 机关要求的为准。自己定的准则,则是按需处理(按自己的利益)。 比如说:我说我家不让任何人进入,否则我就揍人,但是还是有人进入了。此时,我没有揍他,但是,我揍他也是合理的,因为我声明过了。 再比如说,ZF 说翻墙违法。但是抓不抓的决定权在他们手上。 另外,人工审核的话,也没法判断源头及版权问题(比如大家都搬油管的同一视频),且审核人员也不是同一个,不可能每一个视频上来就得跟所有的视频库作对比。 换个角度说,如果出现是视频被他人抢先上传了,然后原作者再上传,但没法验证此视频的原作者是谁。此时,审核人员把后传的原作者的拒绝了。这样,原作者肯定又要开帖去讨伐 B 站了。 技术上如果像百度网盘那样过滤色情视频的话应该可以做到,用一特征来过滤估计可以实现。 |
49
locoz OP @vacua #40 平台方并没有必要也没有很好的办法去辨别是否是同一个人,只需要大致相同就行了,我从上面的被侵权作者列表中随便挑一个:
相机逻辑 CamLogic https://www.youtube.com/channel/UCt1YdG1JFVBhL3fC64cREtQ CamLogic 相机逻辑 http://space.bilibili.com/95080790 是不是很明显? 然后你肯定要说会有人假冒那个 UP 主、做了个高仿号的情况,但这种情况你让平台方判断?在不同平台没有联合起来(比如共用的版权链)的当下这种情况根本没法由平台方直接判别,只能依靠 UP 主自己向平台方证明身份、举报。 另外,即使有高仿号存在,平台方也应该在不知道对方是高仿号的情况下保护这个“作者”的权益,这个逻辑会很难理解吗? |
51
locoz OP @skiy #46 如果现在是“抓不抓的决定权”因为各种原因而决定是被别人发现了再抓,那就更应该喷了。
色情视频用 AI 和特征过滤完全没问题,各大厂商都有解决方案,说白了还是成本问题。 |
52
locoz OP |
53
richard1122 2019-08-14 10:40:46 +08:00 1
提个建议,文章里放一大堆奇奇怪怪的表情图以及描述把文章割裂开真的好难读。
比如这一段以及下面一个表情: “ 看到这张图后你可能会心想:这不是百度翻译吗?跟 B 站有啥关系啊?快说正经的! 别急嘛,等我把这个故事讲完,很快你就会知道了。 ” |
54
locoz OP @richard1122 #51 难以满足所有人的需求,我这之前被提的建议里有很大一部分都是让我加点表情包之类的,一坨文字看不下去
|
55
9684xtpa 2019-08-14 11:33:27 +08:00 1
楼主我支持你啊,B 站审核的时候,加一个同一名称视频检测,如果一样的话,将已经存在的视频也给审核,就可以了
|
56
locoz OP @9684xtpa #53 谢谢,是的,其实就是个很简单的事情,给审核人员一个好用的辅助工具就够了,解决这个场景下的问题对 B 站来说几乎 0 成本,只不过考虑到更多场景的话就比较复杂而已。
文章里有说直接检测同标题视频会产生的问题:可能会因为不同平台的运营方向不同,有些 UP 主会自己改成了不同的标题,直接判断是不是同标题的话并不能解决问题。不过做成短文本相似度匹配的话效果应该还不错。 |
57
skiy 2019-08-14 11:58:57 +08:00
@locoz
对啊。所以我一直都说了,是企业利益的问题。不符合他们的利益,他们肯定不会这么卖力去做。 需要时间成本,人工成本。 站大了,视频量大了,审核员还是这么多。所以,他们更愿意让用户自己去举报才去处理。 我从来就没有说他们做得对。 |
58
locoz OP @skiy #55 我知道你没有说他们做得对。
我只是觉得如果随着平台发展,审核水平反而倒退了的话,就很...更何况是个几乎 0 成本就能解决的问题。 另外举报也是由人来处理的,目前看起来似乎并不是很有效,这些机器搬运号搬了这么多侵权的出来还没被封就能变相说明一些问题,这是文章里喷的另一个点。 |
59
msg7086 2019-08-14 12:18:56 +08:00
对方 UP 主授权你帮他们维权了吗?如果你在没有对方授权的情况下帮他们维权,是代替他人行使著作权的行为,也就是你维权的行为本身就侵犯了他人的著作权。
我不反对你维权,但是也要提请你注意,不要自己先侵犯了著作权,知法犯法。 |
60
locoz OP @msg7086 #57 我可没有自称我是他们的代言人之类的,我做的只是:
1、描述一个发现 2、拿出数据证明有这种大量侵权的情况 3、作为一个普通用户,举报视频给 B 站 4、发送相关侵权视频给 up 主 5、将上述操作和时间写成文章发表,尝试引起 B 站重视 当然如果有 up 主认为我这种行为不妥,他也可以联系我删文,没什么问题。 |
62
ThomasZ 2019-08-14 12:31:43 +08:00 via Android
营销号躺着月入过万,不都要靠 up 主的努力么? 你可以跟粉丝声明一下视频并未授权其他任何账号,然后粉丝基本都会帮你举报一波的
|
64
ThomasZ 2019-08-14 12:40:12 +08:00 via Android
@locoz 好吧,没有爬楼。。。 b 站现在感觉只要政治正确,不涉及黄赌毒就基本上能上了,我平时看连动的熊猫视频有时候都能看到营销号一刀未剪的上传上来,还是投的自制
|
65
mzlzero 2019-08-14 13:03:33 +08:00
审核员不背锅,你有想过人肉去重的现实性吗?机器审核?多少年前就有规避的手段了,再说网站上很多视频会用一些相同的素材片段,机器知道是重复吗?难道一个小时的视频逐帧扫描对比?你好歹也是个能在 v2 发帖的互联网人了,怎么跟个小白一样在这无脑狂怒?最后告诉你,发现问题要解决问题,你不会点举报吗?
|
66
msg7086 2019-08-14 13:08:07 +08:00
@locoz #60 能认定侵权的只有执法机构和著作权人。你作为一个第三方群体,直接下定义说某些东西是侵权的,我是觉得不妥。毕竟就算是一眼看上去就知道是侵权的作品,第三方也无权认定。换句话说,在收到著作权人的声明之前,B 站也不能随意认定侵权的作品就是侵权的,他只能以内容不合适之类的理由去下架,而不能说「虽然我没证据,但我觉得你侵权了」所以下架视频。毕竟你第三方并不知道甲乙两方之间是不是有合作协议。
所以我说,一来你可以获得 UP 主的授权,帮助他们维权。另一种做法是收集证据提交给 UP 主,让他们转交给 B 站,同时声明著作权(意味着 B 站可以合法地认定侵权行为并以此下架视频)。 |
68
locoz OP @mzlzero #63 请先完全阅读文章和前面我所回复的内容,并在没有理解错误的情况下再做评价,前面的#3、#45、#47、#58 楼已经可以解答你所说的所有问题了。
|
69
locoz OP @mzlzero #63 #66 补充一下,关于你的最后一句话:“最后告诉你,发现问题要解决问题,你不会点举报吗?”,我认为举报视频和机器搬运号能在某些程度上解决表面问题,但这并不代表解决了根源问题,封了这 25 个帐号或者删除了这 1839 个视频之后,你觉得整个 B 站就没有其他这种情况了吗?再引用我文中所说的半句话:“这还只是那些用了百度翻译的”,机器搬运号多得是。
|
70
locoz OP @msg7086 #64 嗯,是不妥,法务跟我说过。所以文章最后有注明“如果您认为我的文章侵犯了您的权益,或文章内含有侵权的词语、语句,请立即联系我删除”,如果有 UP 主认为不妥,我完全可以直接删文。
双方是否有合作协议这件事情,我无法下定论,但从 B 站空间里的内容来看,文中说的这 25 个帐号都是机器搬运号。 相关证据是有通过 B 站私信发给 UP 主的,也提醒了他们可以拿着列表直接发给 B 站举报。 |
71
mzlzero 2019-08-14 18:20:07 +08:00
@locoz 麻烦再好好看看我发的,前面部分告诉你你的标题有多蠢,后面部分告诉你你的想法有多天真。解决根源问题,请问你觉得根源问题是什么?是 b 站不作为? b 站技术实力不够? b 站懒政?麻烦你告诉我一个切实可行解决问题的方法,我保证你能解决你真的是挺牛的在互联网行业,b 站 a 站抖音头条快手要跪着求你解决
|
72
locoz OP @mzlzero #69 OK OK,既然你不会翻上面我的回复,那我再一条一条的给你回复,好吧?:
审核员不背锅,你有想过人肉去重的现实性吗? 在我说的这个场景下,以[标题 /提取标题得出的关键词]使用站内搜索搜一下就行,以前的 A、B 站审核都是这么做的,当然,现在视频量大,如果没有辅助工具,这么做会加重审核人员的负担。 机器审核? 人肉查询加重负担?没关系,机器还真能辅助这一步,我说的这种场景只需要搜一下就行,标题不一样的问题加个分词 /关键词提取再搜就能解决,给审核人员看视频之前提示一下是否存在重复内容就行了,大量节省时间和精力。 我知道你肯定也想说洗稿问题,阿里云有个叫视频 dna 的服务,具体效果你可以自己去看看,https://ai.aliyun.com/vi/dna,还是那句话:当然成本肯定很高,对于一个商业公司而言并不一定值得去做。但这个问题跟我说的场景并不相关。 多少年前就有规避的手段了,再说网站上很多视频会用一些相同的素材片段,机器知道是重复吗? 上面说的视频 dna 就可以解决,另外,也有很多其他的公司在做这个东西,并不是只有阿里云一家。 难道一个小时的视频逐帧扫描对比? 我查了一下,从目前视频去重相关的产品来看,应该都是抽关键帧,并不需要逐帧扫描。 你好歹也是个能在 v2 发帖的互联网人了,怎么跟个小白一样在这无脑狂怒? 这并不是无能狂怒,单纯地举报并不会引起 B 站重视,你看看现在哪个引起商业公司做出改变的事情是有人向他们投诉、举报就有效的? 最后告诉你,发现问题要解决问题,你不会点举报吗? #3 楼就说了,已经举报过了,并且还给 UP 主私信了完整列表。 另外这个问题根本就不是删掉这些视频、封掉这些号就能解决的,在审核这个根源问题没解决的时候,即使我发现的这些号没了,还会有其他的号,还是上面那句话:“这还只是那些用了百度翻译的”,机器搬运号多得是。 请问你觉得根源问题是什么?是 b 站不作为? b 站技术实力不够? b 站懒政? 根源问题不是不作为,也不是技术实力不够,也不能说是懒政,单纯地就是不够重视。 另外你肯定也想说前面 skiy 说过的:“审核只审核是否违法( Z.F 要求的那些)”,那你看今天被爆出来的涩情视频说白了其实不就是审核人员看不过来,没往后面看,直接就通过了吗?从截图上来看只要有机器鉴黄的步骤,百分百会被检测出来,而现在显然是纯人工的。 然后也不要跟我扯举报解决问题,那个涩情视频的发布时间在 google 的网页快照中可以看到接口返回的数据,"pubdate":1565515441,看不懂的话给你翻译一下:2019-08-11 17:24:01,11 号的视频到 14 号下午才被爆出来,而最后一条弹幕的时间是 13 号下午的,说明至少到昨天下午都没被删,你知道这意味着什么吗? 麻烦你告诉我一个切实可行解决问题的方法,我保证你能解决你真的是挺牛的在互联网行业,b 站 a 站抖音头条快手要跪着求你解决 参见第二个问题的回答,还是要提醒你一下,注意我说的这种场景。 |
74
Joshua999 2019-08-15 17:53:08 +08:00 via Android
b 站真的用不惯,看过的视频都没有标识,推荐的还都是看过的
|
75
greatdancing 2019-08-15 17:53:43 +08:00 via Android
已 B
|
77
locoz OP @greatdancing #73 已回 B
|