DSTK - Data Science Toolkit 3是一套遵循CRISP DM模型的数据和文本挖掘软件。 DSTK使用统计和文本分析,使用标准化和文本处理的数据准备,机器学习和统计学习算法的建模和评估来提供数据理解。
DSTK 3将提供有吸引力的功能,如深度神经网络(深度学习),文本链接分析与可视化,KMeans群集。其中一些功能可能会在旧版本中提供,但由于重写算法以减少Weka等外部库的使用以减小文件大小,因此我们需要更多时间来开发它们。 DSTK Engine仍处于测试阶段,因此可能存在一些错误和不准确。
DSTK 3由DSTK Engine,DSTK ScriptWriter,DSTK Studio和DSTK Text Explorer组成。 DSTK Engine简化为R,专注于数据挖掘。 DSTK ScriptWriter提供GUI来为DSTK Engine编写脚本。 DSTK Studio提供SPSS Statistics,如用于数据挖掘的GUI,DSTK Text Explorer提供用于文本挖掘的GUI。
要求:
Java Runtime Environment,Microsoft。网络框架
限制:
10次试用
评论没有发现