cpdetector 1.0.10

cpdetector项目是代码页检测小而巧的框架。cpdetector是代码页检测,集成了不同的策略,一个小而巧的框架。它可以被用来作为一个库的第三方软件访问在网络文本数据。它还包括一个最佳实践的实施在一个命令行工具,允许整理和改造的基础上的代码页的文件大集合的形式。可用的策略包括:jchardet(排除,频率分析和猜测),检测HTML字符集属性,并检测了XML编码声明的。什么是代码页?首先,一个文本文件无非比特序列。计算机必须决定,他怎么能在字符(由计算机的数字标识)的形式显示此数据。代码页 -...