场景 - 智狐AI导航

makeAd

makeAd是一款基于AI技术的广告创意平台，提供智能场景生成、产品模型图创建、虚拟模特试穿等功能，帮助品牌和营销人员快速生成高质量广告素材。平台支持品牌风格适配、文案生成及多平台适配，适用于电商广告制作、广告策略探索及个性化内容生成，提升广告效率与转化效果。

AI项目与工具 2025年06月11日 74 点赞 0 评论 837 浏览

HumanOmni

HumanOmni 是一款面向人类中心场景的多模态大模型，融合视觉与听觉信息，具备情感识别、面部描述、语音理解等功能。基于大量视频与指令数据训练，采用动态权重调整机制，支持多模态交互与场景理解。适用于影视分析、教育、广告及内容创作等领域，具备良好的可扩展性和灵活性。

AI项目与工具 2025年06月12日 92 点赞 0 评论 836 浏览

SnapDrop

一款跨平台文件传输工具，具有在同一局域网内通过浏览器实现设备间点对点传输文件、图片、文档或文本，具备跨平台兼容、无需安装，网页即开即用的特点。

网盘传输 2025年06月05日 45 点赞 0 评论 835 浏览

腾讯元宝电脑版

腾讯公司推出的一款基于混元大模型的AI助手，拥有AI搜索、AI总结、AI写作等功能，并提供了多个特色AI应用，如AI头像、口语陪练、超能翻译等。

AI写作对话 2025年06月05日 69 点赞 0 评论 834 浏览

TrackVLA

TrackVLA是银河通用推出的端到端导航大模型，具备纯视觉环境感知、语言指令驱动、自主推理和零样本泛化能力。它能在复杂环境中自主导航、灵活避障，并根据自然语言指令识别和跟踪目标对象。无需提前建图，适用于多种场景，如陪伴服务、安防巡逻、物流配送等，为具身智能商业化提供支撑，推动机器人走向日常生活。

AI项目与工具 2025年06月11日 79 点赞 0 评论 834 浏览

Bolt3D

Bolt3D是由谷歌研究院、牛津大学VGG团队与谷歌DeepMind联合开发的3D场景生成技术，基于潜在扩散模型，能在单块GPU上仅需6.25秒生成高质量3D场景。支持多视角输入，具备良好泛化能力，采用高斯溅射技术实现高保真表示，并支持实时交互。适用于游戏开发、VR/AR、建筑设计和影视制作等领域。

AI项目与工具 2025年06月12日 47 点赞 0 评论 832 浏览

FILM

Frame Interpolation是一个开源的神经网络模型，能够在两个视频帧之间生成高质量的中间帧，特别适合需要处理大范围场景运动的应用。

Ai视频生成 2026年06月23日 0 点赞 0 评论 829 浏览

Universal

Universal-1是一款由AssemblyAI开发的多语言语音识别和转录模型，经过大量多语种音频数据训练，支持英语、西班牙语、法语和德语等。该模型在各种复杂环境中提供高精度的语音转文字服务，具备快速响应能力和改进的时间戳准确性。Universal-1在准确率、响应时间、时间戳估计和用户偏好等方面表现优异，适用于对话智能平台、AI记事本、创作者工具和远程医疗平台等多个应用场景。

AI项目与工具 2024年01月01日 88 点赞 0 评论 827 浏览

改写匠ReWriter

一款基于AI和深度学习技术的英文写作智能批改工具，可以帮助用户提升英语写作水平，避免中式英语，增强逻辑衔接性，优化语言表达，提升文章质量。

AI写作对话 2025年06月05日 24 点赞 0 评论 826 浏览

LLaVA

LLaVA-OneVision是字节跳动开发的开源多模态AI模型，主要功能包括多模态理解、任务迁移、跨场景能力、开源贡献及高性能。该模型采用多模态架构，集成了视觉和语言信息，通过Siglip视觉编码器和Qwen-2语言模型，实现高效特征映射和任务迁移学习。广泛应用于图像和视频分析、内容创作辅助、聊天机器人、教育和培训以及安全监控等领域。

AI项目与工具 2025年06月12日 34 点赞 0 评论 826 浏览

场景

首页

场景

列表

默认

浏览次数

发布日期