1 |
scrapy |
一个开源的、基于 Python 的高性能网络爬虫和数据抓取框架。Scrapy 项目最初由伦敦的网络聚合和电子商务公司 Mydeco 的员工以及乌拉圭蒙得维的亚的网络咨询公司 Insophia 的开发者共同创建。目前,Scrapy 由 Zyte(原名 Scrapinghub)公司维护,同时得到全球开源社区的广泛贡献。Scrapy 的特点与优势 高性能与异步处理 Scrapy 基于 Twisted 框架,支持异步 I/O,能够高效处理大量并发请求,适合大规模爬取任务。 模块化与可扩展性 Scrapy 的架构围绕“蜘蛛”设计,支持中间件、管道和扩展,开发者可以自定义爬取逻辑、数据处理和存储方式。 丰富的生态系统 Scrapy 生态包括 Scrapyd(部署服务)、Scrapely(HTML 解析库)、Portia(可视化抓取工具)等,满足不同需求。 跨平台与兼容性 Scrapy 支持 Python 3.9+,可在 Windows、Linux 和 macOS 上运行,兼容多种数据存储格式(如 JSON、CSV、XML)。 |
2 |
fish-speech |
一个先进的开源 TTS 框架,旨在通过大语言模型(LLM)提供高质量、低延迟和多语言的语音合成。Fish-Speech 使用双自回归架构和 RLHF 训练,生成高度自然、流畅的语音,接近专业配音演员的表现力。零样本语音克隆: 通过提供 10-30 秒的参考音频,Fish-Speech 可快速克隆语音,无需繁琐的训练过程。生成的语音保留参考音频的音色和情感。情感与语气控制: 支持丰富的语气和情感标记,如 (angry)、(sad)、(excited)、(laughing)、(sobbing) 等 50 多种标签,生成富有表现力的语音。 用户可通过自然语言指令控制语气,例如 “(whisper) Hello, world!” 或 “Ha,ha,ha” 添加笑声效果。 |
3 |
nautilus_trader |
一个高性能的开源算法交易平台和事件驱动回测框架,专为量化交易设计,由 Python、Rust 和 Cython 编写.NautilusTrader 是一个高性能、事件驱动的算法交易平台,旨在为量化交易者提供回测和实时交易的统一环境。其核心优势在于使用 Rust 和 Cython 编写的核心组件,提供接近 C 的性能,同时保持 Python 的易用性()。项目的主要用途包括事件驱动回测、实时交易、数据处理、策略开发和生产级部署,适合量化交易者、研究人员和企业。 使用场景涵盖高频交易、大型股票池回测、实时数据处理、量化研究、教育学习、企业部署和社区协作。NautilusTrader 的模块化设计、广泛的交易所适配器和活跃社区使其成为算法交易领域的领先工具。 |
4 |
freqtrade |
一个功能全面的开源加密货币交易机器人框架,由以 Matthias Bach 和 Robert Caulk 为核心的开发团队维护,得到全球社区的广泛支持。其主要用途包括自动化交易、回测与优化、机器学习预测、资金管理和数据分析,适合从个人交易者到研究人员和企业的多种用户群体。 使用场景涵盖个人交易、策略开发、机器学习研究、企业级部署、教育学习、低成本设备运行和社区协作等。Freqtrade 的模块化设计、跨平台支持和活跃社区使其成为算法交易领域的强大工具。 |
5 |
dspy |
Declarative Self-improving Python)是一个由斯坦福大学自然语言处理(Stanford NLP)团队开发并维护的开源框架,旨在通过编程而非传统的手动提示(prompting)方式来构建和优化基于语言模型(LM)的AI系统。。其作者团队由斯坦福 NLP 研究人员领衔,结合了学术研究和工程实践,吸引了全球开发者的广泛参与。DSPy 的主要用途是构建模块化、可优化的 AI 系统,支持从知识密集型问答到代码生成等多样化任务。它的使用场景涵盖研究原型、企业应用、本地模型部署等多个领域,尤其适合需要复杂推理或知识检索的场景 |
6 |
chinese-poetry |
最全中华古诗词数据库, 唐宋两朝近一万四千古诗人, 接近5.5万首唐诗加26万宋诗. 两宋时期1564位词人,21050首词,此数据库通过 JSON 格式分发,可以让你很方便的开始你的项目。。 |
7 |
puter |
一个先进的开源互联网操作系统,设计为功能丰富、速度极快且高度可扩展。Puter 可用作: 一个以隐私为优先的个人云,将所有文件、应用程序和游戏保存在一个安全的地方,随时随地可访问。 构建和发布网站、Web 应用程序和游戏的平台。 Dropbox、Google Drive、OneDrive 等的替代品,具有全新的界面和强大的功能。 服务器和工作站的远程桌面环境。 一个友好的开源项目和社区,学习 Web 开发、云计算、分布式系统等更多内容! |
8 |
agenticSeek |
一个 100% 本地替代 Manus AI 的方案,这款支持语音的 AI 助理能够自主浏览网页、编写代码和规划任务,同时将所有数据保留在您的设备上。专为本地推理模型量身打造,完全在您自己的硬件上运行,确保完全的隐私保护和零云端依赖。其主要优势在于隐私保护、低成本和灵活的模型支持,适用于个人生产力、开发辅助、学术研究和隐私敏感场景。尽管项目处于 Beta 阶段,存在一些技术挑战,但其活跃的社区和开源性质使其具有巨大潜力。开发者、研究人员和 AI 爱好者可以通过贡献代码或参与讨论,共同推动 AgenticSeek 成为一个功能强大、类似 Jarvis 的本地 AI 助手。 |
9 |
DeepFaceLab |
一个功能强大且灵活的深伪制作工具,广泛应用于娱乐、影视、研究和实时应用场景。它通过深度学习技术实现了高质量的人脸替换、去老化等功能,深受 YouTube 创作者、艺术家和研究人员的喜爱。DeepFaceLab 允许用户将视频或图片中的人脸替换为另一个人的脸。例如,可以将一个演员的脸替换为另一个人的脸,生成逼真的效果。 它通过训练深度神经网络(主要是 SAEHD 模型)来实现高质量的人脸替换,能够达到接近电影级别的逼真效果。DeepFaceLab 使用 Python、TensorFlow 和 CUDA,支持 NVIDIA GPU 加速训练和推理。它还支持 OpenCL,兼容部分 AMD GPU 和 CPU(尽管性能较低)。 项目提供预编译的 Windows 版本,以及 Linux 和 Google Colab 支持,方便不同平台的用户。 |
10 |
VideoLingo |
一站式视频翻译本地化配音工具,能够一键生成 Netflix 级别的高质量字幕,告别生硬机翻,告别多行字幕,还能加上高质量的克隆配音,让全世界的知识能够跨越语言的障碍共享。 |