scikit-learn庫是什么?Python的開源社區(qū)非常活躍,也有很多和Java等開源語言一樣的框架或庫體系,其中Scikit-learn(簡寫成sklearn)是最著名的Python機器學習庫之一。官方網址為http://scikit-learn.org/stable/。
sklearn基于BSD開源許可證,最早由David Cournapeau在2007年發(fā)起,目前也是由社區(qū)自愿者進行維護,經年累月,整個項目的內容已經相當豐富了,目前最新的穩(wěn)定版是0.17版本。
用戶手冊內容也很友好,覆蓋面很全,包括有監(jiān)督的學習(分類)、無監(jiān)督的學習(聚類)、模型選擇與評價、數(shù)據集轉換、數(shù)據集提取應用(數(shù)據示例下載)、大規(guī)模計算策略、計算效率七大部分。
機器學習算法大多使用sklearn庫完成,主要涉及Supervised learning和Unsupervised learning兩個部分,相信它也能幫助讀者在生產生活中很大程度地提高生產效率。
在安裝sklearn之前請確認Python已經安裝。安裝Python的方法見附錄C。
如果發(fā)現(xiàn)Python軟件未被正確安裝,可以使用CentOS系統(tǒng)自帶的包管理工具“yum”進行安裝。安裝方法如下:
然后安裝sklearn。sklearn的安裝很簡單,只要能夠連接上互聯(lián)網,直接使用pip安裝即可: