Scikit-learn 的 DictVectorizer 怎麼使用

以往使用的機器學習(Machine Learning)工具都是 LIBSVM,而這次因緣際會用了 Python 的 scikit-learn,卻不知道如何使用自己的 Feature,剛好來記錄一下。 scikit-learn 很強大的內建了幾種 Feature generator,像是 CountVectorizer、TfidfVectorizer...等等。而 DictVectorizer 則可以搭配自己的 Feature ,用法如下: from sklearn.feature_extraction import DictVectorizer vectorizer = DictVectorizer(sparse=False) features = [ {'feature_name_1': 1, 'feature_name_2': 2}, {'feature_name_1': 3, 'feature_name_…

使用 Python 處理中文 JSON

最近在處理大量的中文 json 檔案,一直遇到編碼上的問題,相信大家也都有遇過, UnicodeEncodeError: 'ascii' codec can't encode characters in position 2-10: ordinal not in range(128) 也就是 ascii 無法順利編碼,最後得到了一個解決方法:調整 ensure_ascii 參數以及使用codecs。 我們用example.json當做範例: [ { "category": "數位生活", "content": "

Pelican Custom Syntax Highlighting

不久前將我 code block 改了個樣子並且加上行號(line number),自己是比較喜歡現在這樣。所以這篇就來講一下,要如何客製化 code block 這個部分。 要做到這些事情得仰賴 Codehilite 這個套件,它可以藉由 linenums 這個選項自動產生行號,並產生既有的結構方便規劃,能節省許多時間。 首先我們在 pelicanconf.py 裡頭加上 MD_EXTENSIONS 這個參數。 :::python #! pelicanconf.py MD_EXTENSIONS = ['fenced_code', 'extra', 'codehilite(linenums=True)'] 拿上面的程式碼舉例,設定完 MD_EXTENSIONS 後你產生的 code block 結構會如下,因此得知要修改的 css class…

Mac 上安裝 OpenCV

OpenCV 是圖像處理裡面很猛的一個套件。之前用純 make 去安裝,每每碰壁,於是我發現 Homebrew 的美好,來記錄一下! 安裝 / Installation 在開始之前,當然要確定自己有[Homebrew](http://brew.sh/)。 首先使用 doctor 檢查自己的 brew 有沒有問題 :::bash $ brew doctor 然後要轉移到 science 的倉庫裡 :::bash $ brew tap homebrew/science 接著就可以安裝 OpenCV 了 :::bash $ brew install opencv 再來換到 OpenCV 的目錄底下(要注意自己 OpenCV 的版本) :::bash $ cd /usr/…

THE FUTURE IS NOW

從以往的經驗來看,未來大致上長這樣, 不那麼清楚,也肯定艱難。 抓緊機會,努力不讓自己怠慢。 如果女人最大的敵人是地心引力,那我大概就是惰性 LOL…

Tipue Search - Pelican 的文章搜尋

每個部落格都需要「搜尋」這個功能,文章少時還好,多了以後想找就不方便。Pelican 並沒有內建文章搜尋的功能,但倒是有個滿酷的套件, Tipue Search 。 Tipue Search Serializes generated HTML to JSON that can be used by jQuery plugin. 簡潔有力的說明,就是將文章轉換成 JSON 檔案,搭配上 jQuery 進行文章搜尋。 設定 / Configuration Tipue Search 在 python 的部分是仰賴 BeautifulSoup 這個套件,所以在使用前得先確定自己有沒有安裝。 :::bash $ pip install beautifulsoup4 下載 Tipue Search,然後將裡面的 static…

漸漸的,我們長大

我們從小就喜歡聊天,遵循著一種老人模式, 談天說地,也算是摯友了吧! 讀大學後,大家各奔西東, 聽不一樣的聲音、看不一樣的世界, 受到刺激後,慢慢找到自己的理想。 而隨著年齡的增長,每次回家鄉聚聚的時間也越來越少, 但我們都知道,是彼此的羈絆。 一起向前, 回憶起,肯定又得來個, 爐邊閒談。…

Pelican 套用 Fancybox

Fancybox 是什麼? 我們先看看官方說明 fancyBox is a tool that offers a nice and elegant way to add zooming functionality for images, html content and multi-media on your webpages. It is built on the top of the popular JavaScript framework jQuery and is both easy to implement and a snap to customize.…

Moving to Pelican

:::python while True: self.update(life) 尋尋覓覓,換了好幾種 Blog ,但都不是很喜歡,就覺得跟語言有關係 lol ,於是找到這個 pelican ,看起來親切多了! Keep going.…