模型 - 智狐AI导航

Vision Search Assistant

Vision Search Assistant (VSA) 是一种结合视觉语言模型与网络代理的框架，旨在提升模型对未知视觉内容的理解能力。它通过网络检索，使 VLMs 能够处理和回答有关未见图像的问题。VSA 在开放集和封闭集问答测试中表现出色，支持图像描述生成、网络知识搜索、协作生成等功能，可应用于图像识别、新闻分析、教育、电商和旅游等多个领域。

AI项目与工具 2025年06月12日 100 点赞 0 评论 860 浏览

万智

万智是零一万物推出的企业级AI解决方案，支持快速部署大模型，兼容多种硬件和架构，具备本地化部署能力，保障数据安全。平台集成RAG、联网搜索等功能，提升企业决策效率，并提供模型微调工具以满足垂直领域需求。采用Rewrite和Rerank技术优化输出准确性，显著提升性能。

AI项目与工具 2025年06月12日 90 点赞 0 评论 859 浏览

TeleAI

TeleAI-t1-preview是中国电信人工智能研究院开发的复杂推理大模型，具有强大的数学与逻辑推理能力。它在多项国际评测中表现优异，尤其在数学竞赛和古籍解析方面表现突出。模型融合了强化学习与思考范式，支持从文言文到现代汉语的数学题解析，并具备策略推理与单位换算等功能。该模型即将上线天翼AI开放平台，未来将在教育、科研等领域广泛应用。

AI项目与工具 2025年06月12日 88 点赞 0 评论 859 浏览

URM

URM是由阿里妈妈开发的通用推荐模型，结合大语言模型与电商领域知识，提升推荐效果。其采用多模态融合与Sequence-In-Set-Out生成方式，支持多场景、多目标、长尾及发现性推荐。具备高效率、零样本学习能力，适用于工业级推荐系统，已应用于阿里妈妈展示广告场景，优化用户体验与商家投放效果。

AI项目与工具 2025年06月11日 85 点赞 0 评论 859 浏览

WorldScore是由斯坦福大学推出的统一世界生成模型评估基准，支持3D、4D、图像到视频（I2V）和文本到视频（T2V）等多种模态。它从可控性、质量和动态性三个维度进行评估，涵盖3000个测试样本，包括静态与动态、室内与室外、逼真与风格化等多种场景。WorldScore具备多场景生成、长序列支持、图像条件生成、多风格适配等功能，适用于图像到视频、图像到3D生成以及自动驾驶场景模拟等应用，为研究

AI项目与工具 2025年06月12日 87 点赞 0 评论 859 浏览

FUZZ

由Riffusion推出的一款基于扩散模型（Diffusion Model）的全新音乐生成模型，该工具能够通过“想象”生成音频的声谱图（Spectrogram），然后将其转换为音频。

Ai语音工具 2025年06月05日 33 点赞 0 评论 859 浏览

TrackGo

TrackGo是一种先进的AI视频生成技术，利用自由形状的遮罩和箭头提供精确的运动控制。其核心技术TrackAdapter无缝集成到预训练的视频生成模型中，通过调整时间自注意力层来激活与运动相关的区域。TrackGo在视频质量、图像质量和运动忠实度方面表现出色，适用于影视制作、动画制作、虚拟现实（VR）、增强现实（AR）和游戏开发等多个领域。

AI项目与工具 2025年06月12日 64 点赞 0 评论 859 浏览

AniTalker

AniTalker是一款先进的AI工具，能将单张静态人像与音频同步转化为生动的动画对话视频。它通过自监督学习捕捉面部动态，采用通用运动表示和身份解耦技术减少对标记数据的依赖，同时结合扩散模型和方差适配器生成多样且可控的面部动画。AniTalker支持视频驱动和语音驱动两种方式，并具备实时控制动画生成的能力。

AI项目与工具 2025年06月12日 62 点赞 0 评论 858 浏览

TechGPT

TechGPT是一个强大的垂直领域大语言模型，具备处理专业领域文本的能力，并在信息抽取、智能问答和序列生成等方面表现出色。

Ai平台模型 2026年06月23日 0 点赞 0 评论 858 浏览

SWEET

SWEET-RL是Meta开发的多轮强化学习框架，专为提升大型语言模型在协作推理任务中的表现而设计。通过引入训练时的额外信息优化“批评者”模型，实现精准的信用分配与策略优化。在ColBench基准测试中，其在后端编程和前端设计任务中表现出色，成功率提升6%。适用于文本校对、社交媒体审核、广告合规等多种场景，具备高度的通用性和适应性。

AI项目与工具 2025年06月12日 15 点赞 0 评论 857 浏览

模型

首页

模型

列表

默认

浏览次数

发布日期