V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
cristie
V2EX  ›  程序员

求助:高维数据聚类合适算法。

  •  
  •   cristie · 2012-03-08 21:28:41 +08:00 · 4225 次点击
    这是一个创建于 4643 天前的主题,其中的信息可能已经有所发展或是发生改变。
    想来想去,都觉得高维数据聚类太坑爹。我这里需要解决的1000维度以上的数据点有上万个,神马算法都是坑爹的慢。嘛,于是我想要高人叫我一个方法,恩,能够对维度1000+的数据进行聚类。

    我看到一个文章,恩,《基于k最相似聚类的子空间聚类算法》,我想试试这个算法,有没有人能告诉我这个算法在这个问题上可行性如何?

    另外,如果大量数据要使用抽样的方式进行聚类,应该如何操作?一头雾水啊。
    4 条回复    1970-01-01 08:00:00 +08:00
    wellsho
        1
    wellsho  
       2012-03-10 23:17:11 +08:00
    去到数理统计、数据挖掘论坛逛逛吧
    维度高可以先做降维
    降维可以用特征选择,也可以用特征提取
    willsons7
        2
    willsons7  
       2012-03-15 11:11:10 +08:00
    降维,可以看看random projection相关的东西。
    但是貌似感觉你说的数据直接用CLUTO就可以聚类,如果是稀疏的就更好做了。
    ElloRay
        3
    ElloRay  
       2012-03-15 11:20:02 +08:00
    k-means做太复杂了吧
    ElloRay
        4
    ElloRay  
       2012-03-15 11:21:38 +08:00
    跟一楼想的一样。。先做好特征提取吧
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   987 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 21ms · UTC 19:43 · PVG 03:43 · LAX 11:43 · JFK 14:43
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.