Apache Tika 1.9

的Apache提卡是作为一个低级别的工具包内查找其他文件的内容。蒂卡没有做太多自己是一个简单的库,但它可以集成更多的功能强大的工具,如搜索引擎,数字资产管理系统或CMS的,以提供一个全功能的文件搜索系统。这个库可以访问不仅仅是文件的标题,以便快速全面的文件资料,也可以去真正深入并在该文件的正文中搜索甚至对于不同类型的数据,文本或二进制格式。多种文件类型支持和提卡也可以与其他编程语言多亏了一系列第三方的绑定和包装使用。 什么是此版本的新 在此版本包括bug修复和新功能,包括新的tesseract...