开源项目

Casibase

一个开源的AI知识库和对话系统,支持多种主流 AI 模型,具备企业级功能和多语言界面,适合企业知识管理和智能对话场景。

LivePortrait

利用AI技术将静态照片转换为视频,展现逼真的面部表情和动作。

Agent Development Kit

Agent Development Kit(ADK)是谷歌推出的开源AI智能体开发工具,采用Python实现,支持多智能体架构和复杂任务编排。提供丰富的工具生态、灵活的工作流定义、流式交互支持及广泛的LLM兼容性,帮助开发者快速构建、测试和部署AI代理,提升系统效率与可扩展性。

SadTalker

SadTalker是一个由西安交通大学、腾讯AI实验室和蚂蚁集团合作开发的开源AI数字人项目。该工具利用单张人脸图像和语音音频,通过3D运动系数生成逼真的说话人脸动画。它通过ExpNet精确学习面部表情,PoseVAE合成不同风格的头部运动,并采用3D面部渲染技术,实现高质量、风格化的视频动画。SadTalker还具备多语言支持和多模态学习能力,适用于虚拟助手、视频制作、语言学习、社交媒体和教育等

PinTree

一个可以帮助用户将浏览器书签快速转换为美观的导航网站的开源项目。

OmniSQL

OmniSQL 是一款开源的文本到 SQL 转换工具,能将自然语言问题精准转化为 SQL 查询语句。它基于大规模数据集 SynSQL-2.5M 进行训练,涵盖 250 万条样本,覆盖 16,000 余个跨领域数据库。支持多种复杂查询类型,提供思维链推理过程,并提供 7B、14B 和 32B 三种模型版本。适用于企业数据分析、教育及跨领域应用,提升数据访问效率与学习体验。

SuperTinyIcons

一个收集了丰富 Logo的SVG 图标库,目前已收集386+ 个主流的品牌和产品的 Logo,包括GitHub、Twitter、Facebook等。适合用于网页设计、移动应用开发。

TTS-vue

TTS-Vue是一个开源的桌面应用程序,它利用了微软的语音合成技术,为用户提供了一个简单易用的文本到语音转换工具。

VPP

VPP(Video Prediction Policy)是清华大学与星动纪元联合开发的AIGC机器人模型,基于视频扩散模型实现未来场景预测与动作生成。支持高频预测与跨机器人本体学习,显著降低对真实数据的依赖。在复杂任务中表现出色,适用于家庭、工业、医疗、教育等多个领域。其开源特性推动了具身智能机器人技术的发展。

Agent Squad

Agent Squad 是一个轻量级、开源的多 Agents 框架,用于协调多个 AI Agents 处理复杂对话。它支持 Python 和 TypeScript 两种语言,具备智能意图分类、灵活的 Agent 响应(流式与非流式)、上下文管理等功能,并提供模块化安装和可扩展架构。适用于智能客服、旅行规划、企业助手等场景,帮助开发者快速构建高效的多 Agents 系统。