模型 - 智狐AI导航

LeviTor

LeviTor是一款由多所高校和企业联合研发的图像到视频合成工具，它利用深度信息和K-means聚类点来控制视频中3D物体的轨迹，无需显式3D轨迹跟踪。通过高质量视频对象分割数据集训练，该工具能精准捕捉物体运动与交互，支持用户通过简单的2D图像操作实现复杂的3D效果，大幅降低了技术门槛，广泛应用于电影特效、游戏动画、虚拟现实等领域。

AI项目与工具 2025年06月12日 52 点赞 0 评论 761 浏览

Pix2Gif

Pix2Gif是一个由微软研究院开发的基于运动引导的扩散模型，能够将静态图像转换成动态的GIF动画或视频。该模型通过运动引导的扩散过程实现图像到GIF的生成，并利用文本描述和运动幅度作为输入。Pix2Gif还引入了感知损失机制，确保生成的GIF帧在视觉上与原始图像保持一致性和连贯性。

AI项目与工具 2024年01月01日 30 点赞 0 评论 761 浏览

BitsAI

BitsAI-CR是字节跳动推出的基于大型语言模型的自动化代码审查工具，采用两阶段处理流程提升审查精度。通过219条规则检测潜在问题，并结合“过时率”指标动态优化规则。支持多语言审查，可无缝集成到现有流程中，自动识别问题、生成评论并跟踪修改情况，提升代码质量与开发效率。

AI项目与工具 2025年06月12日 37 点赞 0 评论 761 浏览

Pixtral Large

Pixtral Large是一款由Mistral AI开源的超大规模多模态模型，具备1240亿参数，支持文本、图像和图表的理解与生成。它拥有128K的上下文窗口，能在多语言环境中处理复杂文档和多图像场景，广泛应用于教育、医疗、客服和内容审核等领域。

AI项目与工具 2025年06月12日 39 点赞 0 评论 762 浏览

Webdraw

Webdraw 是一款无代码 AI 应用开发平台，支持图像生成、视频制作、聊天助手等功能，用户可通过自然语言或可视化工具快速构建应用。平台集成多种 AI 模型，支持多模态内容创作，具备文件共享、实时协作和一键部署能力，适用于创意设计、个性化工具开发、教育及企业场景，降低 AI 技术使用门槛。

AI项目与工具 2025年06月12日 99 点赞 0 评论 762 浏览

MotionGen

MotionGen是一款由元象科技开发的3D动作生成模型，它结合了大模型、物理仿真和强化学习算法，使得用户通过简单的文本指令就能生成逼真且流畅的3D动作。该工具简化了3D动画的制作过程，提升了创作效率。其主要功能包括文本到动作的转换、高度逼真和流畅的动作生成、个性化定制、高效的制作流程和技术融合。

AI项目与工具 2025年06月12日 96 点赞 0 评论 762 浏览

MathGPT

MathGPT，是国内首个专为数学打造的大模型。仅需要通过文字或图片上传数学题，即可得到对话式的解答反馈。另外，你也可以通过「随机来一题」的选项，随机生成数学题目并由系统给出解答。

Ai平台模型 2025年06月05日 81 点赞 0 评论 762 浏览

Embodied Reasoner

Embodied Reasoner是由多家科研机构联合开发的具身交互推理模型，通过视觉搜索、推理与行动协同完成复杂任务。采用模仿学习、自我探索和自我修正三阶段训练方法，生成多样化思考过程，提升任务规划效率。在长时序任务中表现优异，减少重复搜索和逻辑错误。适用于智能家居、仓储物流、医疗辅助等多个场景，具备多模态交互和强推理能力。

AI项目与工具 2025年06月11日 88 点赞 0 评论 763 浏览

SeedFoley

SeedFoley 是由字节跳动开发的端到端视频音效生成模型，能智能识别并生成与视频内容高度同步的动作和环境音效。通过融合视频时空特征与扩散生成技术，提升音效的准确性和细腻度，支持多种视频长度，适用于生活Vlog、短片制作、游戏视频等多种场景，显著提升视频的沉浸感和表现力。

AI项目与工具 2025年06月12日 63 点赞 0 评论 763 浏览

Flex.2

Flex.2-preview是Ostris开发的开源文本到图像生成模型，具备80亿参数规模。支持长文本输入、图像修复和多模态控制输入，适用于创意设计、图像修复和内容生成等多种场景。模型基于扩散框架，采用多通道输入处理和高效推理算法，可通过ComfyUI或Diffusers库集成使用，适合实验性开发和个性化定制。

AI项目与工具 2025年06月11日 20 点赞 0 评论 764 浏览

模型

首页

模型

列表

默认

浏览次数

发布日期