V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
推荐学习书目
Learn Python the Hard Way
Python Sites
PyPI - Python Package Index
http://diveintopython.org/toc/index.html
Pocoo
值得关注的项目
PyPy
Celery
Jinja2
Read the Docs
gevent
pyenv
virtualenv
Stackless Python
Beautiful Soup
结巴中文分词
Green Unicorn
Sentry
Shovel
Pyflakes
pytest
Python 编程
pep8 Checker
Styles
PEP 8
Google Python Style Guide
Code Style from The Hitchhiker's Guide
huzhikuizainali
V2EX  ›  Python

数据分析、数据挖掘从业人员研究的算法 与 计算机科学所学的“算法”有什么差别?

  •  
  •   huzhikuizainali · 2020-12-14 10:18:15 +08:00 · 1650 次点击
    这是一个创建于 1439 天前的主题,其中的信息可能已经有所发展或是发生改变。
    数据分析、数据挖掘从业人员研究的算法 与 计算机科学所学的算法有什么差别?两个“算法”是否有界限或区隔(可以是非严格的界限和区隔)?可否举例说明?还请行业从业人员指教!

    注:这里所说的数据分析、数据挖掘从业人员不包括做基础设施建设的从业者。例如:开发维护 pandas 、Scikit 、TensorFlow 库的从业者。
    这里所说的数据分析、数据挖掘从业人员大多数情况下是使用这些库去完成工作的人。
    4 条回复    2021-01-05 13:34:56 +08:00
    VZXXBACQ
        1
    VZXXBACQ  
       2020-12-14 12:27:58 +08:00
    个人觉得没有什么区别

    如果要说为什么第一眼看起来差别这么大,可能在一个直接基于离散数学,另一个是最直接基于概率论与线性代数

    两者其实是共通的,比如做数据分析里面就有很多算法用了 DP
    potian001
        2
    potian001  
       2020-12-14 12:37:25 +08:00
    在实际岗位中
    数据分析的内容大多数是写 SQL,统计、分析、可视化一些已有数据,为领导、产品、运营的决策提供帮助。
    算法一般是要将模型上线并且直接负责效果的。 这里面涉及模型训练(数据生成,样本清洗,调参....),和模型上线(线上架构,线上效果,线上性能,线上策略....)
    huzhikuizainali
        3
    huzhikuizainali  
    OP
       2020-12-14 12:49:55 +08:00
    @potian001 那像二叉搜索树、贪心算法、图算法(包括但不限于上述计算机科学专业教授的算法内容)是否在数据挖掘工作中经常使用?或者数据分析、数据挖掘领域有自己常用的算法体系。与上述计算机专业的算法几乎没什么交集?
    potian001
        4
    potian001  
       2021-01-05 13:34:56 +08:00
    @huzhikuizainali 除了面试,几乎不用
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1072 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 23ms · UTC 19:07 · PVG 03:07 · LAX 11:07 · JFK 14:07
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.