A.運算速度快,適用于具有較多迭代次數(shù)的算法 B.具有易用性,RDD中封裝了大量的操作,ᨀ供了經(jīng)典機器學習算法的API C.集成度高,能夠與Spark上的其他組件進行無縫對接 D.運行原理是將Spark程序轉(zhuǎn)換為MapReduce程序運行,并行度高
A.–input偏好數(shù)據(jù)路徑 B.–output推薦結(jié)果路徑 C.–clusters初始聚類中心點文件路徑 D.--overwrite對輸出路徑進行重寫
A.判斷抽樣 B.整群抽樣 C.配額抽樣 D.滾雪球抽樣
A.改變模型,例如使用樸素貝葉斯等對偏斜不敏感的模型 B.升采樣 C.降采樣 D.蓋帽法
A.均值 B.額外增加一類標簽表示缺失 C.中位數(shù) D.眾數(shù)