模型 - 智狐AI导航

ILLUME

ILLUME是一款基于大型语言模型的统一多模态大模型，集成了视觉理解与生成能力，采用“连续图像输入 + 离散图像输出”架构，通过语义视觉分词器和三阶段训练流程，实现了高效的数据利用和多模态任务处理能力。模型能够无缝整合视觉理解与生成功能，广泛应用于视频分析、医疗诊断、自动驾驶及艺术创作等领域。

AI项目与工具 2025年06月12日 54 点赞 0 评论 945 浏览

GigaTok

GigaTok 是一款基于语义正则化的高参数视觉分词器，支持自回归图像生成，具备优异的图像重建与生成能力。通过一维架构和非对称扩展策略，实现高效计算与稳定训练。适用于图像生成、编辑、数据增强及多模态应用，具有广泛的技术拓展性。

AI项目与工具 2025年06月11日 74 点赞 0 评论 944 浏览

InternVideo2.5

InternVideo2.5是一款由上海人工智能实验室联合多机构开发的视频多模态大模型，具备超长视频处理能力和细粒度时空感知。它支持目标跟踪、分割、视频问答等专业视觉任务，适用于视频检索、编辑、监控及自动驾驶等多个领域。模型通过多阶段训练和高效分布式系统实现高性能与低成本。

AI项目与工具 2025年06月12日 50 点赞 0 评论 942 浏览

TestSprite

TestSprite 是一款基于 AI 的自动化测试平台，支持后端 API、前端 UI、数据及 AI 模型的测试，能够自动生成测试计划、执行测试并输出详细报告。其核心优势在于提升测试效率、减少人工干预，并适用于多种测试场景，如软件发布前验证、CI/CD 集成、生产环境监控等，帮助企业提升软件质量与交付速度。

AI项目与工具 2025年06月12日 39 点赞 0 评论 940 浏览

Text2CAD

Text2CAD 是一款基于人工智能的在线 CAD 设计工具，能够将自然语言描述快速转换为高精度的 CAD 模型。支持多种格式导出，具备快速设计、精准转换、易修改、云存储与协作等功能，适用于工业设计、教育、原型开发、VR/游戏设计及个性化定制等多个领域。平台提供不同版本的订阅服务，满足不同用户需求。

AI项目与工具 2025年06月11日 22 点赞 0 评论 938 浏览

Kokoro

Kokoro-TTS是一款由hexgrad开发的轻量级文本转语音工具，基于StyleTTS 2与ISTFTNet架构，支持多种语音风格和自然语调，具备实时处理能力。支持美式与英式英语，提供10种语音包，适用于教育、游戏、客服等多种场景。支持本地部署与API集成，确保数据安全与高效运行。

AI项目与工具 2025年06月12日 33 点赞 0 评论 937 浏览

DeepClaude

DeepClaude 是一款高性能开源 AI 工具，融合 DeepSeek R1 和 Claude 模型，具备推理、创造力和代码生成能力。它提供零延迟响应、端到端加密和本地 API 管理，保障数据安全。支持高度自定义，适用于智能客服、代码生成、推理分析及教育等多场景，满足多样化需求。

AI项目与工具 2025年06月12日 71 点赞 0 评论 935 浏览

CogVideoX v1.5

CogVideoX v1.5是一款由智谱研发的开源AI视频生成工具，具备文本到视频生成、图像到视频转换等功能，支持高清视频输出及音效匹配。它通过三维变分自编码器（3D VAE）、Transformer架构等技术手段，提升了视频生成的质量与效率，适用于内容创作、广告营销、教育培训等多个领域。

AI项目与工具 2025年06月12日 19 点赞 0 评论 935 浏览

VidTok

VidTok（Video Tokenizer）是一款由微软开发的开源视频处理工具，通过高效的算法将视频内容转化为“视频词”，支持连续与离散分词化，具有灵活的压缩率和多样的隐空间，适用于视频生成、内容建模及数据压缩等场景。其混合模型架构结合卷积与采样模块，辅以有限标量量化技术，实现了高质量视频重建与高效数据处理。

AI项目与工具 2025年06月12日 54 点赞 0 评论 934 浏览

LiblibAI·哩布哩布AI【官网】

限时免费的LoRA炼丹炉！更全、更热门的素材，为所有AI绘画者提供更得心应手的平台，持续深耕专业领域。

Ai绘画生成 2026年06月23日 0 点赞 0 评论 934 浏览

模型

首页

模型

列表

默认

浏览次数

发布日期