V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  lavande  ›  全部回复第 7 页 / 共 10 页
回复总数  191
1  2  3  4  5  6  7  8  9  10  
2015-07-23 14:22:40 +08:00
回复了 WilddogGo 创建的主题 程序员 “程序员大解放”摇滚音乐节重磅来袭!!!
本来为lz捏一把汗……看完回复差点以为v2变成豆瓣了……
2015-07-21 18:38:17 +08:00
回复了 wbsdty331 创建的主题 问与答 妹妹给我送了一台 mbp,我应该送她什么东西
这么巧我妹妹也送了我一台mbp,然而是二手的……
2015-07-14 19:20:28 +08:00
回复了 ning1022 创建的主题 PHP 大学已经毕业,不想找工作,想创业怎么办?
就是做生意嘛,宽泛地讲也可以称作创业
客户有了,再培养一些技术员工,哪怕一开始是临时工,然后自己并不需要做具体的技术活,而是转向管理、客户开发、资源整合什么的……说白了就是要想着方法怎么剥削别人
2015-07-10 13:40:32 +08:00
回复了 wahyd4 创建的主题 分享发现 DigitalOcean 完成 B 轮 8300 万美元融资
一直觉得DO口碑应该不错啊,没想到这么多被喷,用了大半年,感觉也不错……当然可能因为我要求不高吧!
2015-07-09 10:37:01 +08:00
回复了 sillyBoy 创建的主题 支付宝 支付宝 9.0--十一年来最大的一次蜕变
太卡,早就卸载了,以前不用微信支付的,现在转微信支付去了……
2015-07-04 23:29:22 +08:00
回复了 laiyingdong 创建的主题 分享发现 全国首例:手机因预装软件过多遭公益诉讼
就像挣来争去最后“还是看脸”一样,这玩意儿最后还是因为你预装的软件讨不讨人喜欢
上面提到预装google全家桶,和预装BAT的各种全家桶,你们对比感受一下
2015-06-27 18:50:57 +08:00
回复了 DreamCMS 创建的主题 分享发现 锤子便签 Web 版已经向所有用户开放。
竟然要手机号,擦,豁出去了,,注册……
牛逼,赶紧clone一个
2015-06-12 21:18:35 +08:00
回复了 sciooga 创建的主题 分享创造 可能是 V2EX 最好用的插件
FAQ是Frequently Asked Questions的缩写,F&Q这个写法没有意义,但可以写成Q&A,即questions and answers
我不是程序员。。。。我确实是个“玩音乐的”。。。。
@hm279 原来如此……不过有一定概率是你看完统一生词解释,然后去读文章,然后发现又忘了啥意思,然后又回去查解释……
赞成2L
另外想问lz为啥男程序员coding时候不听歌?
不太清楚为什么要这样做……识别率怎么样也比不过用户自己啊,我看到一个词瞬间就知道我认不认识,然后要是不认识:在电脑上直接划线取词,在纸质文本上用手机摄像头+ocr取词,立刻就查到了,觉得很流畅啊,为啥要先过滤出生词来?
2015-06-09 15:24:06 +08:00
回复了 wilsoncao 创建的主题 macOS 在 mac 正确使用 word 的姿态
libre office writer不错哇,我的论文全程用的这玩意儿,最后导出pdf去打印,完工!
2015-06-06 11:23:36 +08:00
回复了 DreamCMS 创建的主题 奇思妙想 大家是否自己每天处于过度阅读中?
@samael 虽然没找到图中的选项,不过我直接把朋友圈这个功能给停用了,就是说“发现”那一栏点出来没有朋友圈这一项了哈哈哈,感觉不错!
2015-06-05 15:53:28 +08:00
回复了 cacoo 创建的主题 奇思妙想 作品不再是被创作,而是被发现
不过想想这个工作,给人工来做反而更高效。
一个有趣的经验就是,“读书破万卷,下笔如有神”
其实你的大脑里有个模型,在读书时候在不知觉地训练,最后当你输出时发现这个模型已经被训练得很厉害了,写出了好文章。
只是我们不太清楚大脑究竟是怎么工作的……
2015-06-05 15:50:09 +08:00
回复了 cacoo 创建的主题 奇思妙想 作品不再是被创作,而是被发现
@cacoo 我估计作为“个体户”,搞出3000字的小说是非常困难的,因为没有那个计算能力,除非能找到超级计算机给你用……
另外就是lz的三个步骤我觉得不是太合理,1和2其实是可以合并的,因为1生成出来的东西可以说99%甚至更多是垃圾数据,不如在每一次生成时就套用一次2中的规则,符合则储存,不符合直接丢弃,不然太浪费储存。所以说到底其实就是利用规则直接穷举文本,而这个穷举出来的每个文本都应该是人类可读的,所以这个规则(模型)要非常非常强大,这就得有很大的语料库让你来训练模型了吧……建立这个语料库估计是个苦差事

我们来做点“小”工程吧,比如缩小到“国内独立民谣音乐人歌曲的歌词”,说一下我的做法:
1、收集国内独立民谣音乐人的名单,然后收集每个人的所有作品的歌词;
2、将这些歌词处理,建成语料库;
3、分析语料,构建(找)一个合理的语言模型;
4、训练这个语言模型;
5、用这个模型穷举可能的歌词作品(最后可能发现最好给个主题限制,不要穷举比较好);
6、人工判断是否可用,或后续修改和润色,完成。
1  2  3  4  5  6  7  8  9  10  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3811 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 36ms · UTC 05:05 · PVG 13:05 · LAX 21:05 · JFK 00:05
Developed with CodeLauncher
♥ Do have faith in what you're doing.