• Stanford’s Core NLP Suite
    处理多语种的自然语言处理框架
  • Natural Language Toolkit
    NLTK工具是耳熟能详的
  • Apache Lucene and Solr
    简单地说,你可以在这个基础之上构建自己的搜索引擎
  • Apache OpenNLP
    与斯坦福的库不同,它能迅速让你跑起来
  • GATEApache UIMA
    它省去了你大部分在构建NLP应用的过程中一些的冗余工作
  • gensim
    文档相似性分析
  • spaCy
    工业强度的自然语言处理 ## 理论支撑
    1. Taming Text
    2. Natural Language Processing with Python
    3. Foundations of Statistical Natural Language Processing

接下来你可以

## 框架

  • Tensorflow
  • Keras
  • DL4J
  • XGBOOST
  • Theano
  • Torch
  • Caffe
  • MXNet

参考文献

  1. 5 open source tools for taming text

  2. 5 Heroic Tools for Natural Language Processing