Apache Tika

Apache Tika 1.9 更新

的Apache提卡是作为一个低级别的工具包内查找其他文件的内容。蒂卡没有做太多自己是一个简单的库,但它可以集成更多的功能强大的工具,如搜索引擎,数字资产管理系统或CMS的,以提供一个全功能的文件搜索系统。这个库可以访问不仅仅是文件的标题,以便快速全面的文件资料,也可以去真正深入并在该文件的正文中搜索甚至对于不同类型的数据,文本或二进制格式。多种文件类型支持和提卡也可以与其他编程语言多亏了一系列第三方的绑定和包装使用。 什么是此版本的新 在此版本包括bug修复和新功能,包括新的tesseract...

Apache Sqoop

Apache Sqoop 1.4.6 / 1.99.6 更新

Apache的Sqoop是一个必须具备的工具,每一个数据库管理员,让他们轻松地之间的的Hadoop 的NoSQL数据库比较经典的数据库系统,如PostgreSQL中,MSSQL,MariaDB,或MySQL移动数据 -...

Apache Geronimo的需要一些在开源Java社区中最好的企业工具和网格在一起成一个单一的服务器运行时,随时可以部署在生产环境中。Geronimo提供与Eclipse的集成,是的Apache Tomcat 和的Apache Axis2的友好,支持所有主流操作系统。它还支持白羊座的编程模型和Karaf shell命令。至于它的下载,就可以得到该框架的源或二进制软件包,并建立自己的定制的企业级Java服务器运行时,或者你可以三个现成的运行时间(最小,Java的EE6 Web...

阿帕奇AntUnit仅仅是可用于测试本身Ant任务的集合。这些任务特制验证Ant构建文件的完整性,看看是否任何任务或程序返回错误或停止进程。AntUnit基本上是一个单元测试为Ant文件,一个Apache Ant的库灵感的的JUnit 。更多的文档可以在下载包中找到 什么在此版本中是新的: 修正错误:现在LogCapturer可以选择添加(依赖于平台)行,它记录日志信息之间的休息。该日志相关的断言和logcontent资源有一个新的属性和QUOT;...

Apache Blur

Apache Blur 0.2.3

阿帕奇模糊被设计为大的基于文本的搜索查询,针对高容量目标数据。模糊的设计采用的Hadoop 工作,并能实现类似谷歌的索引和查询速度。与模糊使用的其他Apache的技术是 Lucene的 节俭和动物园管理员 特点: 在亚秒级的响应时间在数据库般的查询功能在处理数百个并发查询在调节以适应你的数据的大小在幸存的多节点故障W / O型的数据丢​​失 什么在此版本中是新的: 在支持GIS数据类型在创建的索引快照。在增加存储的字段类型。在添加有启动脚本等安全模式退出的能力。在创建请求和响应日志文件。...

Apache Buildr

Apache Buildr 1.4.23 更新

的Apache Buildr 基本上是一个Java构建基于Ruby的耙系统。就像当初耙,Buildr让开发人员构建更大的项目出了较小的,支持能够装配任何一种类型的文件一起,自动化各种操作复杂的工作程序。一些基本的文件操作包括复制,过滤,缩小,等等。支持还包括预配置的任务,运行单元测试,生成的源代码,甚至JavaDoc的完全兼容的文档文件。依赖关系管理系统,包括开箱即用,以防万一有些文件需要加载他们在同一时间,以及额外的项目。如果你先前使用的...

Apache JAMES Server

Apache JAMES Server 2.3.2 / 3.0 M2

在的Apache James服务器是可以用作新闻和电子邮件递送引擎模块化Java服务器,作为一个独立的或嵌入到其他的应用程序。虽然在默认情况下,你会想发送和接收电子邮件,在Apache James服务器也可以处理各种其他任务也是如此。这些包括邮件列表管理,存储电子邮件在数据库中,队列管理,垃圾杀手集成和热配置重载。支持还包括其他技术,如IPv6中,TLS和LDAP,并且可以将服务器部署到一个经典的Web或OSGI服务器容器 特点: < p> 支持的电子邮件和消息协议:在SMTP 在LMTP 在NNTP...

Apache Spark

Apache Spark 1.6.0 更新

阿帕奇星火旨在提高数据分析和处理程序处理速度。这是写在Java和Scala和提供其它系统所没有的功能,主要是因为他们不是主流,也不是无数据处理的应用程序非常有用。星火先在加州大学伯克利分校AMP实验室创建,后来捐献给Apache软件基金会 本发行版是新的: 统一内存管理 - 执行和缓存,而不是地区独家师共享内存木地板性能 - 使用平板模式时,改善平面扫描性能。改进查询规划具有不同的聚合查询 - 不同的聚合的查询计划时,不同的列具有较高的基数更强大的自适应查询执行 -...

阅读更多
Apache OpenNLP

Apache OpenNLP 1.6.0 更新

的Apache OpenNLP使开发人员可以养活系统的文本块,并使用NLP(神经语言程式学)工具的集合,以检测各种部件。OpenNLP将能够探测到的句子,句子组成部分,实体进行检测,文本解析和分裂等诸多复杂的操作。这些任务的结果可以反馈到其他,与较小的文本样本工作,将不能够在相同的效率,以处理更大的块的文本处理引擎。OpenNLP可以在搜索引擎,文档格式,文档解析,网络爬虫使用,等等。由于该项目采用机器学习方法,你喂的Apache OpenNLP了更多的文字,更好的获得在其工作 什么是此版本的新: <...

Apache Helix

Apache Helix 0.7.1

Apache的螺旋,可用于管理大型计算资源,托管在云基础架构或计算集群。它是建立在另一个顶级Apache项目中,动物园管理员,并提供了与大量节点和资源管理集群的通用接口。与来自Apache类似的项目,螺旋不关心数据和指标的物理资源操纵数据流(服务器本身)。其目的是为使用在服务器创建资源使用和管理的计划,控制资源如何被用来,何时以及如何将数据从一台服务器转移到另一 特点: 在自动资源分配自动分区分配在故障检测在故障恢复在可以处理实时增加新的资源和节点负载均衡在加载节流在可插拔的基础设施 ...