DKPro核心是用Java编程语言和设计为自然语言处理(NLP)的应用程序集合中的开源软件。
其中一些被DKPro核心的组件提供的功能,我们可以提到标记化,分割,复合分裂,遏制,词形还原,标签,形态分析,句法分析,依存分析,指代消解,语言识别,拼写纠错词性的,和语法检查。
基于Apache UIMA框架之中,DKPro核心的项目是由泛在知识处理实验室(UKP)在工业大学与AUML最初开发;吨德国达姆施塔特。
DKPro核心分布作为单独的版本,DKPro核心GPL和DKPro核心ASL,GPLv3的和Apache软件许可证下授权。每个版本都包含不同的功能集
什么在此版本中是新的:
- 在新的API模块
- 在api.phonetics - 在语音层面注释类型
- 在api.semantics - 译注类型的语义信息(语义场和语义角色标注)
- 在新的I / O模块
- 在io.conll - 读者和作家的CONLL 2006年的格式
- 在io.tcf - 读者和作家的CLARIN TCF格式
- 在io.tgrep - 作家为TGrep2语料库文件
- 在io.tiger - 读者的老虎XML格式
- 在新的分析模块
- 在commonscodec - 基于Apache共享编解码器库音译
- 在可降解 - 灵活的组件集合了可降解的,根据不同的分裂和排名算法
- 在队友 - 工具 - 包装的队友,工具套件
- 在morpha - 包装的morpha词干/ lemmatizer
- 在mstparser - 包装的mstparser
- 在SFST - 新模块SFST型形态分析仪
- 在umlautnormalizer - 规范化器在德语文本变音(ASL)
- 在此发布的更多亮点包括:
- 在增加了对解决从远程仓库模型在运行时支持
- 新增@TypeCapabilities注释宣布他们的消费和生产 哪些注解
- 添加自动生成的XML描述符UIMA组件(通过uimafit-Maven的插件)
- 在增加了对ClearNLP语义角色标签的支持
- 在增加了对GATE赫普尔POS恶搞的支持
- 在增加了OpenNLP解析器和名称取景器支持
- 在升级到Apache 2.0.0 uimaFIT
- 在升级到Apache UIMA 2.4.2
- 在更新到ArkTweet,NLP 0.3.2
- 在升级到1.3.1 ClearNLP
- 在升级到3.2.0 CoreNLP
- 在升级到7.1 GATE
- 在升级到1.3.0 jweb1t
- 在升级到2.2 LanguageTool
- 在升级到1.7.2 Maltparser
- 在升级到MATE-工具安娜3.5
- 在升级到1.5.3 OpenNLP
- 在某些模块不再保留,并没有考虑使用,为广大市民,如:所述io.mmax2模块和io.wsdl模块。他们已经退休,不包含在这个版本。
- 在升级时,请介意的,你不应该混用不同版本DKPro核心组件在您的项目 - 他们可能无法互相兼容
要求:
- 在Java 2标准版运行环境
评论没有发现