这创造了8 metalinks的TED演讲中无论是质量水平和可能的通话分组按目录不同这么做
特点:
- 在创建一个具有翔实的文件名的会谈 - 即非常规说明/汉斯·罗斯林的HIV - 新的事实和令人惊叹的数据visuals.mp4,而不是原来的HansRosling_2009_480.mp4
- 在力图让所有的谈判,或至少大部分 - 与如果有些失败一个很好的理由
- 在更多的选择 - 。创造每间可用质量水平(目前为低和高)1 Metalink公司
- 在更多的选择 - 创建每间可用通话集团的一名Metalink公司,与属于同一组放置在一个共同的目录中的所有谈判。可能会谈分组从会谈中提取元数据(目前正在拍摄/出版年,谈的主题和作者)。
- 在整个项目积极缓存,以避免尽可能昂贵的网络/ CPU的操作。适当的缓存失效包括在内。
- 在高水平的容错能力。
- 在简单,但功能强大的自主研发的网络爬虫。
- 在灵活和可扩展的软件设计与改变主意。
- 同时提供控制台脚本和一个公共API。
什么在此版本中是新的:
- 在黑名单无需下载另一通话URL
- 在更新作者和视频元数据标记为TED更新了自己的HTML布局。
什么在2.0.0版本新:
- 在功能增加:
- 修正了#4 - 增加通话字幕支持,按照流行的请求。兰德尔·梅森主要得益于初步实施。
- 在增加并行的履带,从而导致显着的性能提升。
- 补充拍摄的一年,出版年份和事件的名称,以讲座的元数据,从而自动地增加了新的可能的通话组。
- 在增加并行的Metalink公司发电机,从而导致显着的性能提升。
- 在错误修正:
- 在更新的谈话主题标记为TED更新了自己的HTML布局和改进的错误处理。
- 在更新的视频下载标志和下载网址检测代码TED更新了自己的HTML布局。
- 在更新作者标记和检测代码TED更新了自己的HTML布局。
- 在talk_info元数据缓存写入磁盘,尽快减少对错误数据的丢失。
- 在删除setup.cfg因为我们不再需要它。
- 删除从LICENSE梦幻般的-TRAC项目引用。
- 在塔内:
- 从使用setuptools的分发包装交换。
- 在删除履带基于页面缓存,因为它是不再使用,也不需要。
- 从BeautifulSoup交换限于lxml和支持lxml.html.parse去除定制履带代码。
- 从2.4 +被撞至2.6 +最小的Python版本。
- 在重大重构现代化现有的代码库,同时提高代码风格,优化性能和摆脱积累的技术债务。现有的API已经遭遇了一点。
什么在1.0.5版本新:
- 在更新的谈话主题标记为TED更新了自己的HTML布局。
什么版本0.1是新的:
- 在黑名单夫妇谈话的网址,因为他们还没有任何下载了好一阵子。
- 在更新的视频下载标记为TED更新了自己的HTML布局。
要求:
- 在Python中
评论没有发现