hongwuio 最近的时间轴更新
hongwuio

hongwuio

V2EX 第 126027 号会员,加入于 2015-07-07 21:19:02 +08:00
hongwuio 最近回复了
一個不會讓我惹上麻煩的答案 well it depends

首先數據分析, 重視的是分析, 所以用什麼樣的統計學模型去分析問題, 而且最重要的是能夠得出"actionable"結果 i.e.: actionable intelligence. 每一个 business 都是一个 domain, 数据分析都从 business 开始学, 让后再从数据入手, 巧媳妇难为无米之炊, 米时数据, 用什么样的炊就是 R/SAS/Python 这些工具.

就个人而言, R, python 最方便开始学, SAS, 甚至是 SPSS, 都是 enterprise level, 不知道不在工作环境当中你是否能有机会接触到.

自学和工作很不一样的一点就是 data environment, 不同的 data architecture, data structure 说的虚一点就是每个 business, data 有不同的 personality, 这些东西是用简单的一个 csv file 练习不到的. 我能想到的, 应该是多接触一些 open data, 了解不同行业数据的类型, 不是 data type 而是每个行业所关心的 metrics

回到怎么学? 把基本的 data mining method 了解透彻 结合 具体的应用 然后选择一个工具 /语言

**千万不要陷入在工具上的提高所认为自己数据分析能力提高的错觉**
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3450 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 14ms · UTC 11:30 · PVG 19:30 · LAX 03:30 · JFK 06:30
Developed with CodeLauncher
♥ Do have faith in what you're doing.