1
kenlen 2014-04-10 00:06:05 +08:00 5
数据方向是很宽阔的一块领域,我个人认为大体上包括五个方面
1. 数据平台的搭建,就是你现在看的hadoop, spark, storm的生态圈。 2. ETL 也是很重要的一块 ,flume databus 等解决方案来搞. 3. 建设好了基础设施一般上还要有关系型数据库来做data mart,比较牛逼激进的公司会使用些nosql ,hbase之流 这也是一环。 4. 再来就是数据挖掘,对算法要求比较高,把业务问题抽象成数据模型来解决 5. 最后一块是数据展示层或是说数据产品,把你的算法模型也好,牛逼的基础架构也好,要通过数据展示让业务买账,促进公司业务的发展,这才是“大”数据的本质。 自学呢 1,2基本脱离了环境只能学到皮毛,没什么意思,生产环境和书上,实验环境上是完完全全不一样的,倒不如多花点时间在java上面 3. 偏向数据库,可以学学数据库,MYSQL 是很好的方向,也很多东西可以学 4. 学统计学,学机器学习,各式技巧,网上爬数据或公开的数据自己做分析 5. 很多做技术的人比较忽略这点,数据怎么打包成数据产品是很有学问的。这点需要很好的business sense,前端怎么展现的技术点不难. 综合上述,根据你提的问题,我个人建议3对你现在还是是比较合适的,学mysql,很多公司还没大到一定要scale-out才能生存下去,靠谱的DBA现在还是非常吃香的。 |