开源

WhisperChain

WhisperChain 是一款开源语音识别工具,支持实时语音转文本并提供文本优化功能,可去除填充词、优化语法。用户可通过全局热键快速启动语音输入,处理结果自动复制到剪贴板。支持 Streamlit 界面与 FastAPI 架构,适用于会议记录、写作辅助等场景。

Clapper

Clapper是一款基于AI的开源视频编辑工具,旨在通过交互式、迭代和直观的过程简化视频创作流程。其主要功能包括将剧本内容转化为视觉元素、集成多种AI技术、提供导演模式以及支持无限画布和传统界面两种编辑模式。Clapper不仅适用于个人创作,还广泛应用于教育、商业宣传、社交媒体和电影电视制作等领域。

Airtest

​Airtest AI是一个强大的旨在实现跨台的移动应用程序测试的自动化开源框架。它为开发人员提供了一套全面的工具和功能,以简化测试过程并确保其应用程序的可靠性和性能。

PromptBench

一个基于 Pytorch 的 Python 包,用于评估和理解大型语言模型的统一库。它为研究人员提供了用户友好的 API,以便对 LLM 进行评估。

BLIP3

BLIP3-o是Salesforce Research等机构推出的多模态AI模型,结合自回归与扩散模型优势,实现高效图像理解和生成。基于CLIP语义特征,支持文本与图像间的双向转换及图像编辑。采用顺序预训练策略,提升模型性能。完全开源,适用于创意设计、视觉问答、艺术生成等多种场景。

零一万物

零一万物是李开复带队孵化的AI2.0公司,总部注册于北京,集中在大模型技术、人工智能算法、自然语言处理、系统架构、算力架构、数据安全、产品研发等领域。

Gradio

Gradio 是一款开源 Python 工具,用于快速构建和共享机器学习模型的交互式网页界面。支持多类型输入输出组件,具备实时交互能力,并通过服务器端渲染优化性能。Gradio 5 引入性能提升、界面更新及安全性改进,支持实验性 AI Playground,广泛应用于模型演示、教育、原型开发及远程协作等领域。

ViLAMP

ViLAMP是由蚂蚁集团与中国人民大学联合开发的视觉语言模型,专为高效处理长视频设计。采用混合精度策略,支持在单张A100 GPU上处理长达3小时的视频,提升处理效率并降低计算成本。具备长视频理解、关键信息提取、多任务处理等功能,适用于教育、监控、直播、影视制作及智能客服等场景。技术上通过差分关键帧选择与特征合并优化性能,实现精准且高效的视频分析。

LibreChat

一个开源多模态AI对话平台,它支持与多种AI模型服务的集成,包括OpenAI、Azure、Anthropic和Google等。

NewsNow

一款开源的实时热门新闻聚合平台,能让你快速了解国内外的新闻、科技和财经动态。它把微博、知乎、Hacker News 等多个平台的热门榜单都整合在一起,方便你一站式获取信息。