R - 智狐AI导航

Video Alchemist

Video Alchemist是一款由Snap公司研发的视频生成模型，支持多主体和开放集合的个性化视频生成。它基于Diffusion Transformer模块，通过文本提示和参考图像生成视频内容，无需测试优化。模型引入自动数据构建和图像增强技术，提升主体识别能力。同时，研究团队提出MSRVTT-Personalization基准，用于评估视频个性化效果。该工具适用于短视频创作、动画制作、教育、剧

AI项目与工具 2025年06月12日 26 点赞 0 评论 628 浏览

Zerox

Zerox是一款基于GPT-4o-mini模型的开源OCR工具，支持多种文件格式，具备零样本识别能力，可高效处理扫描文档和复杂布局内容。其输出为Markdown格式，便于编辑与使用，同时提供API接口，适用于企业文档管理、学术研究、法律金融等多个场景，显著提升文档处理效率和准确性。

AI项目与工具 2025年06月12日 20 点赞 0 评论 538 浏览

AutoMouser

AutoMouser是一款Chrome浏览器扩展，能够智能记录用户交互行为，并基于OpenAI GPT模型自动生成Selenium测试代码。它支持实时操作跟踪、代码结构优化、JSON日志导出等功能，适用于自动化测试脚本的快速生成与调试，提高了测试效率和可维护性。其核心优势在于简化了测试脚本的创建过程，降低了技术门槛。

AI项目与工具 2025年06月12日 30 点赞 0 评论 649 浏览

Step R

Step R-mini是一款由阶跃星辰推出的推理模型，具备主动规划、尝试与反思能力，适用于数学、逻辑推理、代码开发及文学创作等多种场景。模型基于慢思考机制，支持深度推理与多步骤验证，表现优异。其技术特点包括强化学习、数据质量优化、测试时计算扩展及模型规模增长，实现文理兼修，广泛应用于教育、科研、企业办公等领域。

AI项目与工具 2025年06月12日 43 点赞 0 评论 528 浏览

LlamaV

LlamaV-o1是由阿联酋穆罕默德·本·扎耶德人工智能大学等机构开发的多模态视觉推理模型，具备结构化推理和透明性，支持文本、图像和视频等多种模态的信息处理。该模型引入了VRC-Bench基准测试，涵盖4000多个推理步骤，用于全面评估推理能力。其性能优于多个开源模型，适用于医疗影像分析、金融数据解读、教育辅助和工业检测等场景，具有高准确性和可解释性。

AI项目与工具 2025年06月12日 74 点赞 0 评论 578 浏览

moonshot

moonshot-v1-vision-preview 是一款由月之暗面开发的多模态图像理解模型，具备精准的图像识别、OCR 文字识别和数据解析能力。支持 API 集成，适用于内容审核、文档处理、医学分析、智能交互等多个领域。模型可识别复杂图像细节、分析图表数据，并从美学角度进行图像评价，适合需要高效图像处理和智能交互的应用场景。

AI项目与工具 2025年06月12日 52 点赞 0 评论 661 浏览

Prometheus

Prometheus是一款基于潜在扩散模型的3D生成工具，能够从文本描述中快速生成高质量、高保真的3D场景。其核心技术包括两阶段训练框架、RGB-D潜在空间解耦、前馈生成策略和无分类器引导，确保生成结果在视觉和几何上的准确性与一致性。适用于内容创作、游戏开发、建筑设计等多个领域，显著提升了3D内容生成的效率和质量。

AI项目与工具 2025年06月12日 27 点赞 0 评论 659 浏览

Riona

Riona-AI-Agent 是一款基于 Node.js 和 TypeScript 开发的自动化工具，支持 Twitter、Instagram 和 GitHub 等平台的社交内容生成与管理。它提供定时发布、自动点赞评论、多账户管理及 Cookie 保持等功能，并集成 Google 生成式 AI 模型提升内容质量。用户可上传个性化内容进行训练，实现定制化输出，适用于企业品牌建设和个人账号运营。

AI项目与工具 2025年06月12日 19 点赞 0 评论 473 浏览

MiniRAG

MiniRAG是由香港大学开发的检索增强生成（RAG）系统，专为资源受限环境下的小型语言模型（SLMs）优化。其核心在于语义感知的异构图索引和轻量级拓扑增强检索方法，能够在降低存储需求的同时实现高性能知识检索与推理。该工具适用于即时通讯、个人内容管理、本地文档检索及隐私敏感场景，具备良好的适应性和实用性，为边缘计算和低功耗设备提供高效解决方案。

AI项目与工具 2025年06月12日 79 点赞 0 评论 717 浏览

GR00T

GR00T-Teleop是NVIDIA Isaac GR00T系统的一部分，用于远程操作数据的采集与处理。它基于NVIDIA CloudXR技术连接高保真头显设备，实现手部跟踪数据与机器人环境视图的实时双向传输，支持用户对机器人进行直观控制。该工具为机器人训练、复杂任务执行及危险环境操作提供高质量数据支持，具备低延迟、高精度和强交互性等特点。

AI项目与工具 2025年06月12日 84 点赞 0 评论 565 浏览

R

首页

R

列表

默认

浏览次数

发布日期