衡阳派盒市场营销有限公司

您好,歡迎來電子發燒友網! ,新用戶?[免費注冊]

您的位置:電子發燒友網>源碼下載>數值算法/人工智能>

Spark下的并行多標簽最近鄰算法

大小:1.06 MB 人氣: 2017-11-22 需要積分:2

  隨著大數據時代的到來,大規模多標簽數據挖掘方法受到廣泛關注。多標簽最近鄰算法ML_KNN是一種簡單高效、應用廣泛的多標簽分類方法,其分類精度在很多應用中都高于其他常見的多標簽學習方法。然而隨著需要處理的數據規模越來越大,傳統串行ML-KNN算法已經難以滿足大數據應用中時間和存儲空間上的限制。結合Spark的并行機制和其基于內存的迭代計算特點,提出了一種基于Spark并行框架的ML_KNN算法SML-KNN。在Map階段分別找到待預測樣本每個分區的K近鄰,隨后Reduce階段根據每個分區的近鄰集合確定最終的K近鄰,最后并行地對近鄰的標簽集合進行聚合,通過最大化后驗概率準則輸出待預測樣本的目標標簽集合。串行和并行環境下的對比實驗結果表明,SML_KNN在保證分類精度的前提下性能與計算資源呈近似線性關系,提高了ML_KNN算法對大規模多標簽數據的處理能力。

Spark下的并行多標簽最近鄰算法

非常好我支持^.^

(0) 0%

不好我反對

(0) 0%

      發表評論

      用戶評論
      評價:好評中評差評

      發表評論,獲取積分! 請遵守相關規定!

      ?
      百家乐官| 金百亿百家乐娱乐城| 百家乐官网娱乐网真人娱乐网| 至尊百家乐娱乐平台| 免佣百家乐官网规则| 九头鸟棋牌游戏中心| 金牌百家乐官网的玩法技巧和规则 | 大发888充值500| 百家乐赌假的工具| 百家乐官网电脑赌博| 利来备用| 百家乐官网一邱大师打法| 威尼斯人娱乐城信誉lm0| 百家乐系统分析器| 百家乐官网三遍| 大发888娱乐城大发888大发网| 百家乐信誉平台开户| 米其林百家乐官网的玩法技巧和规则 | 永利高百家乐网址| 百家乐官网十赌九诈| 高雄县| 大发888娱乐城菲律宾| 24山认龙立向| 做生意招财的东西| 百家乐官网英皇赌场娱乐网规则 | 缅甸黄金赌场| 权威百家乐信誉网站| 百家乐洗码软件| 汽车| 大发888游戏客服电话| 百家乐破解仪| 百家乐那个平台好| 百家乐赌博规律| 百家乐赌博破解| 百家乐7scs娱乐场| 百家乐一黑到底| 百家乐赌场走势图| 百家乐的注码技巧| 欧洲百家乐的玩法技巧和规则| 三星百家乐的玩法技巧和规则| 合肥百家乐赌博机|