是处理非结构化数据许多应用程序需要访问的格式化或标记的文档的文本内容。该归档文件组织经常需要访问文本内容,以使文档搜索,使内容聚合,文件档案的报告和开采。搜索和检索应用程序还需要提取和记号化,从各种文件格式的文本。 访问和提取的文件的文本的一个标准的机制是由微软的搜索引擎所使用的IFilter的插件接口提供的。还有微软和其他厂商开发了一些IFilter的实现,涵盖多种文件格式。在多个IFilter的开发标准或可靠性和文本提取质量参差不齐。 Opait文字过滤器是与其他主机以及一个直接与文件格式而工作,并...

阅读更多

显示,添加,修改,删除或单页和多页TIFF文件相关的出口标签。在TIFF文件的标记机制提供了一种手段来扩展文件格式和元数据相关联与图像存档,搜索和检索的目的。 显示,分割,合并,并从多个TIFF文件重新排序图像的网页。 TIFF格式是通过图像处理,扫描,传真,文字处理,光学字符识别等应用的广泛支持。 写在全面托管的C#代码.NET 4.5,可用于个人和商业使用免费。 二进制文件小于200KB(80KB压缩)。 。完整的源代码,仅象征性收费 要求: 的.NET Framework...

文本自动摘要是使用电脑通过提取或合成关键议题或短语,同时保留原有内容的要点,以减少信息的文本内容的过程。这是在自然语言处理一个棘手的问题,因为是一个什么样的很好的总结应该像无金标准。 Opait文本摘要生成是一个免费的在线程序,总结网上的网页,以及从本地计算机上的文件。文件上传,解析成段落,句子和关键词,排名和分类使用统计模型。最相关的句子和关键词然后返回给用户。 Opait文本汇总程序可以在各种格式,包括文本,HTML,PDF和Microsoft...

一个网络应用程序产生的任何文章的摘要有一个按钮被放置在浏览器的收藏夹或书签栏的点击。 安装是一个简单的从产品网站拖放和拖放一个按钮。 可用于整个制品或在浏览器中选择的任何段。此功能允许那些脚本生成或密码保护的网页总结。 提取总结句,关键词和关键短语。摘要可呈单独的,在读取顺序,或在文章的主体突出。 支持多国语言。采用响应迅速的用户界面,从台式机到智能手机的可扩展性。 可以总结从本地驱动器的文件,并支持一些除了HTML文件格式,如PDF和Microsoft...