R

Dream Screen

Dream Screen 是一款基于生成式人工智能技术的视频背景生成工具,旨在帮助创作者通过简单文本输入快速生成高质量视频背景。它提供了多种风格选择,支持个性化定制,并显著简化了短视频制作流程,尤其适用于社交媒体、教育、商业广告及影视制作等领域。其核心优势在于无需专业技能即可生成专业级视觉效果,从而提升内容吸引力与观众体验。

Pocket Flow

Pocket Flow 是一个极简的 LLM(大型语言模型)框架,仅用 100 行代码实现。它具有轻量级、无依赖、无厂商锁定的特点,支持多 Agents、工作流、检索增强生成(RAG)等功能,帮助开发者快速构建基于 LLM 的应用程序。基于 Agentic Coding 范式,AI Agents 协助开发,提升效率。适用于多种编程语言,适合希望用极简方式开发 LLM 应用的开发者。

FireRedASR

FireRedASR是小红书推出的工业级自动语音识别(ASR)模型系列,支持普通话、中文方言和英语,具备高精度和高效推理能力。其包含FireRedASR-LLM和FireRedASR-AED两个版本,分别聚焦于极致精度和计算效率。模型在多个场景如智能助手、视频字幕生成、歌词识别和语音输入中表现出色,且已开源,推动语音识别技术的发展。

Xmind AI

Xmind AI是一款功能强大的思维导图和头脑风暴软件,它通过直观的可视化方式帮助用户组织、管理和扩展思路。Xmind支持多种图表类型,让用户能够以最适合自己的方式捕捉创意和规划项...

RAGEN

RAGEN是一款开源的强化学习框架,专为在交互式和随机环境中训练大型语言模型(LLM)推理代理而设计。它基于StarPO架构,支持多轮轨迹优化和多种强化学习算法,如PPO和GRPO。通过MDP形式化和渐进式奖励归一化策略,RAGEN提高了训练的稳定性和效率。其模块化设计支持多种环境,适用于智能对话、游戏AI、自动化推理等多个领域。

FaceShot

FaceShot是由同济大学、上海AI Lab和南京理工大学联合开发的无需训练的肖像动画生成框架。通过外观引导的地标匹配和基于坐标的地标重定位模块,生成精确的面部地标序列,并结合预训练模型生成高质量动画。其优势在于无需训练、跨领域适配性强、兼容性好,适用于影视、游戏、教育、广告及VR/AR等多个应用场景。

Scispace

SciSpace是一款基于人工智能的工具,帮助用户理解和分析科学研究论文。它提供了高亮文本、提问、提取解释和摘要以及进行文献综述等功能。

eSearch

eSearch是一款基于Electron框架的开源跨平台AI桌面应用,适用于Linux、Windows和macOS系统。它集成了多种功能,包括快速截屏、OCR文字识别、搜索翻译、屏幕录制和屏幕贴图等。凭借简洁的界面和强大的功能,eSearch显著提高了用户在桌面环境中的工作效率,尤其适合教育、办公自动化、设计和内容创作等领域。

TextHarmony

TextHarmony是一款由华东师范大学与字节跳动联合开发的多模态生成模型,擅长视觉与文本信息的生成与理解。该模型基于Slide-LoRA技术,支持视觉文本生成、编辑、理解及感知等功能,广泛应用于文档分析、场景文本识别、视觉问题回答、图像编辑与增强以及信息检索等领域。通过高质量数据集的构建与多模态预训练,TextHarmony在视觉与语言生成任务中表现出色。

Charley.Ai

Charley.ai 是一个AI论文作家,可以帮助您轻松快速地编写原创的内容。Charley.ai可以了解您的要求,从可靠来源找到相关信息,并根据您的需求创建原创和高质量的论文。