模型 - 智狐AI导航

OmniVision

OmniVision是一款面向边缘设备的紧凑型多模态AI模型，参数量为968M。它基于LLaVA架构优化，能够处理视觉与文本输入，显著降低计算延迟和成本。OmniVision支持视觉问答、图像描述等功能，广泛应用于内容审核、智能助手、视觉搜索等领域。

AI项目与工具 2025年06月12日 37 点赞 0 评论 889 浏览

OmniEdit

OmniEdit是一款基于多专家模型监督训练的先进图像编辑工具，支持七种核心图像编辑任务，包括对象替换、移除、添加、属性修改、背景替换、环境变化和风格转换。它能够处理不同宽高比和分辨率的图像，采用EditNet架构，提升了编辑的成功率和图像保真度。OmniEdit在自动与人工评估中表现优异，适用于专业设计、社交媒体内容创作、电子商务、新闻媒体等多个领域。

AI项目与工具 2025年06月12日 26 点赞 0 评论 890 浏览

FramePack

FramePack 是斯坦福大学推出的开源 AI 视频生成模型，通过帧上下文打包和抗漂移采样技术，实现高效、稳定的视频生成。其仅需 6GB 显存即可运行，支持实时高清视频生成，具备灵活的调度策略，适用于多种应用场景，如短视频制作、游戏开发、教育与广告等，显著降低了视频生成的硬件门槛。

AI项目与工具 2025年06月11日 23 点赞 0 评论 890 浏览

智谱清言

智谱清言AI助手基于智谱 AI 自主研发的中英双语对话模型 ChatGLM2，经过万亿字符的文本与代码预训练，并采用有监督微调技术，以通用对话的形式为用户提供智能化服务。

Ai办公效率 2025年06月05日 25 点赞 0 评论 890 浏览

TokenSwift

TokenSwift是由北京通用人工智能研究院开发的超长文本生成加速框架，可在90分钟内生成10万Token文本，效率较传统模型提升3倍，且保持输出质量。其核心优势包括多Token并行生成、动态KV缓存管理、上下文惩罚机制等技术，支持多种模型架构。适用于内容创作、智能客服、学术研究及编程辅助等场景。

AI项目与工具 2025年06月12日 98 点赞 0 评论 892 浏览

BISHENG毕昇大模型

一款基于 Apache 2.0 License 协议正式开源的领先开源大模型应用开发平台，能搭建分析报告生成、知识库问答、对话、要素提取等多种大模型应用。

Ai平台模型 2025年06月05日 14 点赞 0 评论 892 浏览

文修大模型

文修是蜜度提供的一项基于人工智能的校对和润色服务，旨在提高中文文档的质量和表达的流畅性。

创作工具 2026年06月23日 0 点赞 0 评论 893 浏览

o3

o3-pro 是 OpenAI 开发的高级推理模型，继承并优化了 o3 的功能，在复杂问题解决和精确答案提供上表现出色。它集成了 ChatGPT 的多种工具，如网页搜索、文件分析、图像推理和编程等，适合科学研究、编程、教育和写作等领域。尽管响应速度稍慢，但在表达清晰度、逻辑准确性和答案完整性方面表现优异，并在数学、科学和编程等领域的性能上超越了前代模型。

AI项目与工具 2025年06月12日 44 点赞 0 评论 893 浏览

RDT

RDT是清华大学AI研究院推出的一款双臂机器人操作任务扩散基础模型，拥有十亿参数量，可自主完成复杂任务，如调酒和遛狗。该模型基于模仿学习，具备强大的泛化能力和操作精度，支持多种模态输入和少样本学习。RDT已在餐饮、家庭、医疗、工业及救援等领域展现广泛应用前景，推动机器人技术发展。

AI项目与工具 2025年06月12日 83 点赞 0 评论 893 浏览

AniPortrait

AniPortrait是一款由腾讯开源的AI视频生成框架，通过音频和一张参考肖像图片生成高质量的动画。该框架包含两个核心模块：Audio2Lmk模块将音频转换为2D面部标记点，而Lmk2Video模块则基于这些标记点生成连贯且逼真的视频动画。AniPortrait以其高质量的视觉效果、时间一致性和灵活的编辑能力著称，能够精确捕捉面部表情和嘴唇动作。

AI项目与工具 2025年06月12日 68 点赞 0 评论 893 浏览

模型

首页

模型

列表

默认

浏览次数

发布日期