模型 - 智狐AI导航

LM Studio

LM Studio是一个开源的本地大语言模型（LLM）应用平台，提供图形用户界面（GUI）和命令行界面（CLI），便于用户使用大型语言模型。LM Studio支持从Hugging Face等平台下载兼容的模型文件，并提供了一种“Playground”模式，用户可以通过该模式同时运行多个AI模型，以增强性能和输出。此外，LM Studio还具备模型发现功能，能够在应用首页展示新的和值得关注的LLMs

AI项目与工具 2025年06月12日 42 点赞 0 评论 420 浏览

轩辕大模型

国内首个开源的千亿级中文对话大模型

Ai平台模型 1970年01月01日 0 点赞 0 评论 420 浏览

AssemblyAI

一个提供将音频文件、视频文件和实时语音转录为文字的平台，提供了一个简单的API，允许用户访问用于转录和语音理解的即可用的AI模型。

Ai语音工具 2025年06月05日 57 点赞 0 评论 419 浏览

DrivingDojo

DrivingDojo是一个由中国科学院自动化研究所与美团无人车团队合作研发的数据集，包含18,000个视频片段，涵盖全面的驾驶操作、多智能体交互及开放世界驾驶知识。它定义了动作指令跟随（AIF）基准，用于评估世界模型的预测能力，并支持自动驾驶算法开发、世界模型训练、多智能体交互模拟及罕见事件处理等多个应用场景。

AI项目与工具 2025年06月12日 85 点赞 0 评论 419 浏览

BAGEL

BAGEL是字节跳动开源的多模态基础模型，拥有140亿参数，采用混合变换器专家架构（MoT），通过两个独立编码器捕捉图像的像素级和语义级特征。它能够进行图像与文本融合理解、视频内容理解、文本到图像生成、图像编辑与修改、视频帧预测、三维场景理解与操作、世界导航以及跨模态检索等任务。BAGEL在多模态理解基准测试中表现优异，生成质量接近SD3，并适用于内容创作、三维场景生成、可视化学习和创意广告生成等

AI项目与工具 2025年06月11日 92 点赞 0 评论 418 浏览

Cerebellum

Cerebellum是一款结合Claude 3.5 Sonnet与Selenium WebDriver的智能化浏览器助手，通过构建网页浏览的有向图模型，利用LLM技术分析页面内容和交互元素，智能规划操作路径并动态调整策略。它支持多浏览器操作，可精确模拟用户行为，广泛应用于网页自动化测试、数据抓取、内容管理及电子商务等多个领域。

AI项目与工具 2025年06月12日 54 点赞 0 评论 417 浏览