开源

CogVideo

目前最大的通用领域文本生成视频预训练模型,含94亿参数。CogVideo将预训练文本到图像生成模型(CogView2)有效地利用到文本到视频生成模型,并使用了多帧率分层训练策略。

CrewAI

CrewAI是一个开源平台,专注于构建和部署多智能体AI解决方案,支持企业快速自动化关键工作流程。平台具备强大的API集成能力和隐私安全保障,允许用户将多智能体团队转换为API,并在隔离的虚拟私有云环境中运行。CrewAI还提供了丰富的模板和自动化工具,简化智能体的创建和部署过程,并支持多种模型定制选项。此外,CrewAI还拥有高效的监控系统,用于持续改进和优化智能体团队的性能。应用场景涵盖客户服

Pollinations AI

Pollinations 是一个通过AI生成媒体内容的平台。平台可能提供多种类型的模板和工具,支持文本、图像、音频、视频等多媒体格式的创作。

Agent Development Kit

Agent Development Kit(ADK)是谷歌推出的开源AI智能体开发工具,采用Python实现,支持多智能体架构和复杂任务编排。提供丰富的工具生态、灵活的工作流定义、流式交互支持及广泛的LLM兼容性,帮助开发者快速构建、测试和部署AI代理,提升系统效率与可扩展性。

FeedMe

FeedMe是一款面向Android用户的离线RSS阅读工具,支持多种订阅源,具备内容聚合、自动更新和AI摘要功能。用户可离线阅读文章和播客,提升信息获取效率。基于Web技术构建,支持跨平台使用和个性化部署,适用于日常信息浏览、学习研究、行业跟踪和个人兴趣管理等多种场景。

Kotaemon

Kotaemon 是一款基于RAG技术的开源工具,支持用户通过自然语言与文档进行互动,从而实现高效的信息检索和理解。它支持多种语言模型,包括OpenAI、Azure OpenAI和Cohere等,提供简易的安装脚本。Kotaemon 还支持多用户协作、文档管理和复杂的推理方法,并允许用户自定义UI元素。其主要功能包括基于RAG技术的问答系统、多语言模型支持、文档管理、混合RAG管道、多模式问答支持

kokoroTTS

一款开源、高性能的文本转语音(TTS)模型,Kokoro TTS拥有8200万参数,基于StyleTTS 2架构,提供高质量、自然的语音合成,适用于有声书、播客等。

Chatlog

Chatlog 是一款开源聊天记录分析工具,支持微信、QQ、Telegram 等平台的数据解析与可视化。通过智能分析高频词、情感倾向及活跃时段,帮助用户快速提取关键信息。具备本地化处理、数据可视化、自动化报告生成等功能,适用于个人社交分析、团队协作优化及商业客户洞察场景。

OOMOL

OOMOL(悟墨)是一款基于 VSCode 的现代化 IDE,专为工作流自动化设计。通过拖拽式界面,用户可快速构建复杂流程,无需编程基础。内置 Python 和 Node.js 环境,结合容器化技术实现跨平台一致性和数据安全。原生支持 AI 功能,涵盖数据科学、多媒体处理和模型开发等场景,适合开发者高效构建和共享工作流。

IterComp

IterComp是一种基于迭代反馈学习机制的文本到图像生成框架,由多所顶尖高校的研究团队联合开发。它通过整合多个开源扩散模型的优势,利用奖励模型和迭代优化策略,显著提升了生成图像的质量和准确性,尤其在多类别对象组合与复杂语义对齐方面表现突出,同时保持较低的计算开销。IterComp适用于艺术创作、游戏开发、广告设计、教育和媒体等多个领域。