重装系统和 node、hexo,部署博客到线上后,发现显示空白。
阅读全文
简单来说,两者都是对词的归一化,但 Stemming(中文一般译为词干提取,以下简称 stem)更为简单、快速一些,通常会使用一种启发式方法去掉一个词的结尾。 Lemmatization(中文一般译为词形还原,以下简称 lemma)更为「智能」一些,上下文相关,有一个 vocab,不在其中的词不会被处理:
阅读全文
NLP and Python developer, sometimes datavis, he/him. Stick to what you believe.
author.job