Gensim
From Wikipedia, the free encyclopedia
主な機能
Gensimには、fastText[2]、word2vec、doc2vecアルゴリズムのストリーミング並列化実装に加えて[3]、潜在意味解析(LSA、LSI、SVD)、非負値行列因子分解(NMF)、潜在的ディリクレ配分法(LDA)、tf-idf、およびランダム射影が含まれている[4]。
Gensimの新しいオンラインアルゴリズムのいくつかは、Gensimの制作者であるRadim Řehůřekの2011年の博士論文『Scalability of Semantic Analysis in Natural Language Processing(自然言語処理における意味解析のスケーラビリティ)』にも掲載されている[5]。