Emdros是一个开放源代码的文本数据库引擎进行存储和分析或注释文本的检索。
Emdros具有强大的查询语言询问的数据相关的问题。
Emdros具有了处理分析或注释文本领域有着广泛的适用性。应用领域包括语言学,出版,文本处理,并且处理注释文本的其他领域。
Emdros提供文本的概念模型,可以是相当解放使用,一旦它已经被掌握。
元数据也可以被存储,所以只要有可与之相关联的一些文本元素。
Emdros既是语料库语言学(大量的文字)和现场语言学(小数据量)好。
固定语料库,如圣经经文,是很好的候选使得Emdros有用。 Emdros目前正在使用的希伯来语圣经大型数据库。
字典也有可能的目标。 Emdros支持文本文档到微小的细节的结构,而不是失去大局。
Emdros体现文本称为EMdF模型的特定模式。基于XML的数据模型的主要优点是,对象类型(如页面和章节)不需要被分层结构或嵌入的,但可能会重叠。此外,对象(如一个条款或短语)不必是连续的,但可以具有间隙。
Emdros可以输出其在XML结果。该XML带有自己的独立DTD和验证与验证解析器。
Emdros架构
Emdros装配到一个软件结构如下:
+ --------------- +
|客户|用户编写
+ --------------- +
|
+ --------------- +
| MQL | Emdros
+ --------------- +
|
+ --------------- +
| EMdF | Emdros
+ --------------- +
|
+ --------------- +
| DB |的PostgreSQL或MySQL
+ --------------- +
在顶部,有你,用户,必须写一个客户端。此客户端将利用Emdros的服务,以提供对您的particlar数据库域的需要。
然后再来两Emdros层:该层MQL和EMdF层。在微量润滑层提供了一个接口的MQL语言。该MQL层自动将EMdF层,后者将MQL查询到SQL调用底层数据库的优势。
底层数据库以存储数据和检索它的指示而EMdF层的照顾。
这Emdros处理数据域是文本。 Emdros提供文本的某一抽象,使得它非常适合于存储和检索注释文本,例如文本的语言分析。
这些分析可以是,例如,句法分析,形态分析,或话语分析,或所有这些。语音分析也支持在一定程度上。
Emdros是在那里领域研究问题需要问的注释文本的数据库特别有用。这将包括词典决策,圣经的语言研究(希腊语或希伯来语),其他语言的研究,和一般注释文本的研究。
Emdros有文字称EMdF模型的特定模式。用户已经证明,我们的经验表明,当与文本作为一个程序员或程序设计的交易模式EMdF可以是相当解放。
- 语言分析:因此,与注释文本处理的任何应用程序将
功能有可能受益于Emdros和EMdF模型。是主要的目标域。这包括所有层面的分析,如词法,句法,语篇分析,甚至音韵在一定程度上。
- 出版也是行业里Emdros可能是有用的。 Emdros支持打破了文成的页面,章节,段落等。
- 在文字处理可能会受益于Emdros如果问题涉及注释的文本。
什么在此版本中是新的:
- 全文搜索实验的支持,增加李。 >
- 的RenderObjects和RenderXML功能得到了加强。
- 在一般速度的提高,得到。
- 支持加入构建最近的Linux发行版,以及为建设有qmake的支持。
什么版本3.2.0是新的:
- 在升级到SQLite的3.6.17和PCRE 8.01。
- 的TIGERXML进口商现在对输入更为宽松。
- 的Emdros查询工具现在可以输出XML格式,并能创造从命令行PNG图像。
在什么版本3.1.0是新的:
- 在错误修正:
- 在长期存在的bug,#1217003对SourceForge.Net的Emdros bug跟踪系统,已得到修复。基本上,在对象引用是在地形MQL处理方式的设计错误。这有时可能会导致误导性和/或不完整的结果。
- 错误#2021303已定。它说,在Emdros查询工具,设置和]选项=安静"在配置文件将需要一个不得不调整窗口大小以获得显示在所有的任何输出。
- 功能增强:
- 的Emdros查询工具现在能够将其输出保存为HTML。当输出包含树木,它们被保存为PNG格式。
- 增补libharvest,这是与QUOT文库;收获" Emdros对象。
- 添加一个JSON解析器,在libharvest使用。
- 的Emdros查询工具,现在不显示任何工具提示,这对用户就想关闭。
- 在对象引用用法现在可以参考自己的块。例如,这是现在可能:[Word作为W1 //注意如何引用同一对象的两个特征。 phrase_dependent_part_of_speech = w1.part_of_speech]
- 在Linux桌面,菜单项添加了Emdros查询工具,该组块Emdros工具以及Emdros导入工具。
- 的Emdros查询工具和Emdros分块工具都显著在快显示结果。
- 的Emdros查询工具现在能够在其输出显示水平树木。
- 的Emdros查询工具现在能够输出结果为KWIC一致性(KWIC =关键词在上下文中)。
- MatchedObject :: getFeatureAsString()现在返回的枚举的标签,而不是整数的列表清单时,该功能是枚举的列表。
- 获取物体HAVING单子IN的速度得到了提高。
- 的TigerXML进口商现在能够从语言树构造导入* .ltcx文件。
- 构建变化:
- 在GCC 4.3现在支持。
- 在PostgreSQL的8.3版本是目前唯一支持的版本,在所有平台上。
- Emdros现在都可以转,内置64位的Fedora 10。
- Emdros现在可以构建在x86的Solaris。
- 的RPM现在得到的分布标识符(例如,FC9)在RPM名自动。
- 的Python SWIG DLL在Win32现在被称为_Emdros.pyd而不是_Emdros.dll。
- 在Mac OS X上,无论是10.4和10.5由相同的二进制文件的支持。
- 的wxWidgets 2.4不再支持;只有2.6和2.8然。
- 在Mac OS X和Linux / Unix下,非Unicode版本Emdros都不再支持。
- 在痛饮CSHARP现在能够使用GMCS对于.NET的绑定。
评论没有发现