R - 智狐AI导航

PengChengStarling

鹏城实验室开源的一款多语言语音识别系统开发工具包，PengChengStarling可以在统一的框架内处理多种语言语音输入，支持实时语音识别，边说边识别。

Ai语音工具 2025年06月05日 66 点赞 0 评论 470 浏览

商汤日日新 | SenseNova

商汤日日新垂直领域场景落地应用丰富。

Ai平台模型 2025年06月05日 20 点赞 0 评论 470 浏览

SkyCode天工智码

Sky-code 是 SingularityAI 研发的一款AI代码生成工具，支持各种主流编程语言，助力开发人员更快更好的编码。

Ai编程建站 2025年06月05日 49 点赞 0 评论 469 浏览

卡内基梅隆大学

卡内基梅隆大学（Carnegie Mellon University），简称CMU，是坐落于美国宾夕法尼亚州的匹兹堡的私立大学，“新常春藤”，全球大学校长论坛成员。拥有14,800名在校学生和1,483名教职...

教育学习 1970年01月01日 0 点赞 0 评论 469 浏览

DynamicCity

DynamicCity是由上海AI Lab开发的大规模动态场景生成框架，支持高质量4D LiDAR场景的生成与重建，适用于自动驾驶、机器人导航、虚拟现实等多个领域。该框架基于VAE和DiT模型，实现高效的场景编码与生成，支持轨迹引导、指令驱动生成和动态修复等多种应用，展现出优异的性能和广泛的应用潜力。

AI项目与工具 2025年06月12日 63 点赞 0 评论 469 浏览

Google Vids

一款由谷歌在2024年推出的人工智能驱动的视频创作工具，专为职场设计，目的在于简化和加强工作环境中的视频创建和编辑流程。

Ai视频生成 2025年06月05日 91 点赞 0 评论 468 浏览

Jamba

Jamba是由AI21 Labs开发的基于Mamba架构的生产级别大语言模型，结合了结构化状态空间模型（SSM）和传统Transformer架构，具备高吞吐量和低内存占用的特点。Jamba拥有256K的上下文窗口，适用于处理长文本序列，并且以开放权重的形式发布，遵循Apache 2.0开源许可。该模型主要用于研究领域，未来将推出更安全的版本。

AI项目与工具 2024年01月01日 29 点赞 0 评论 468 浏览

Zerox

Zerox是一款基于GPT-4o-mini模型的开源OCR工具，支持多种文件格式，具备零样本识别能力，可高效处理扫描文档和复杂布局内容。其输出为Markdown格式，便于编辑与使用，同时提供API接口，适用于企业文档管理、学术研究、法律金融等多个场景，显著提升文档处理效率和准确性。

AI项目与工具 2025年06月12日 20 点赞 0 评论 468 浏览

VARGPT

VARGPT是一款多模态大语言模型，整合了视觉理解和生成任务于统一的自回归框架中。它通过next-token和next-scale预测机制，支持文本与图像的混合输入和输出，具备高效的视觉生成能力。模型采用三阶段训练策略，提升了在视觉问答、推理及图像生成任务中的表现。适用于多模态内容创作、指令到图像合成等场景。

AI项目与工具 2025年06月12日 17 点赞 0 评论 467 浏览

AgentScope

AgentScope是一个由阿里巴巴集团开源的多智能体开发平台，支持构建和部署复杂的多智能体应用。它提供易用的拖拽式界面、实时监控和丰富的开发资源，涵盖聊天、图像生成、文本嵌入等任务。AgentScope具备高鲁棒性、分布式支持及容错机制，同时支持多模态数据处理和外部知识库的整合，适用于智能助手、客户服务、软件工程、社会模拟和教育培训等多个应用场景。

AI项目与工具 2025年06月12日 59 点赞 0 评论 467 浏览

R

首页

R

列表

默认

浏览次数

发布日期