CDA數(shù)據(jù)分析師多項選擇題每日一練(2020.05.06)

多項選擇題
對MLlib的特點描述正確的是（）
A.運算速度快，適用于具有較多迭代次數(shù)的算法
B.具有易用性，RDD中封裝了大量的操作，ᨀ供了經(jīng)典機器學習算法的API
C.集成度高，能夠與Spark上的其他組件進行無縫對接
D.運行原理是將Spark程序轉(zhuǎn)換為MapReduce程序運行，并行度高
多項選擇題
Mahout中實現(xiàn)的kmeans聚類命令的必選參數(shù)是（）
A.–input偏好數(shù)據(jù)路徑
B.–output推薦結(jié)果路徑
C.–clusters初始聚類中心點文件路徑
D.--overwrite對輸出路徑進行重寫
多項選擇題
下列哪些方法屬于非概率抽樣（）。
A.判斷抽樣
B.整群抽樣
C.配額抽樣
D.滾雪球抽樣
多項選擇題
在一個二分類的分類預測問題中，如果二分類中的某一類占比超過80%，那么可以考慮哪些方法去改進？（）
A.改變模型，例如使用樸素貝葉斯等對偏斜不敏感的模型
B.升采樣
C.降采樣
D.蓋帽法
多項選擇題
分類型變量的缺失值可以怎樣填充？（）
A.均值
B.額外增加一類標簽表示缺失
C.中位數(shù)
D.眾數(shù)

<li id="ioz0h"><dl id="ioz0h"></dl></li>

<pre id="ioz0h"><noframes id="ioz0h"><rt id="ioz0h"></rt>

<rt id="ioz0h"><small id="ioz0h"><rt id="ioz0h"></rt></small></rt>