R
Pocket Flow
Pocket Flow 是一个极简的 LLM(大型语言模型)框架,仅用 100 行代码实现。它具有轻量级、无依赖、无厂商锁定的特点,支持多 Agents、工作流、检索增强生成(RAG)等功能,帮助开发者快速构建基于 LLM 的应用程序。基于 Agentic Coding 范式,AI Agents 协助开发,提升效率。适用于多种编程语言,适合希望用极简方式开发 LLM 应用的开发者。
HivisionIDPhotos
HivisionIDPhotos 是一款基于人工智能技术的证件照制作工具,支持智能抠图、多尺寸证件照生成等功能。该工具还计划在未来版本中增加智能换正装和美颜功能。它支持 Docker 部署,并提供 API 接口以便开发者集成和自动化证件照生成流程。适用于个人、企业人力资源、教育机构、在线服务提供商及摄影工作室等多种应用场景。
FireRedASR
FireRedASR是小红书推出的工业级自动语音识别(ASR)模型系列,支持普通话、中文方言和英语,具备高精度和高效推理能力。其包含FireRedASR-LLM和FireRedASR-AED两个版本,分别聚焦于极致精度和计算效率。模型在多个场景如智能助手、视频字幕生成、歌词识别和语音输入中表现出色,且已开源,推动语音识别技术的发展。
Generative Omnimatte
Generative Omnimatte 是一种基于 AI 的视频编辑技术,通过其核心模型 Casper 实现视频的多层次分解与编辑。它能够自动分离物体与背景,并支持动态背景处理及多对象场景的精细编辑。主要功能包括视频分层、对象移除、背景替换、Trimask 控制等,广泛应用于电影制作、广告设计、游戏开发及虚拟现实领域。
