应用 - 智狐AI导航

Aya Vision

Aya Vision 是 Cohere 推出的多模态、多语言视觉模型，支持 23 种语言，具备图像描述生成、视觉问答、文本翻译和多语言摘要生成等能力。采用模块化架构与合成标注技术，确保在资源有限条件下仍具高效表现。适用于教育、内容创作、辅助工具开发及多语言交流等多个场景，具有广泛的实用价值。

AI项目与工具 2025年06月12日 70 点赞 0 评论 517 浏览

TheoremExplainAgent

TheoremExplainAgent（TEA）是一款基于多模态技术的AI工具，可生成超过5分钟的数学与科学定理解释视频，涵盖多个STEM领域。它结合文本、动画和语音，提升抽象概念的理解效果，并具备自动错误诊断功能。通过TheoremExplainBench基准评估，TEA在准确性、逻辑性和视觉表现上均表现优异，适用于在线教育、课堂教学和学术研究等多种场景。

AI项目与工具 2025年06月12日 13 点赞 0 评论 722 浏览

PodAgent

PodAgent是一款由多所高校与企业联合开发的播客生成框架，采用多智能体协作机制，模拟真实脱口秀场景，自动生成高质量对话内容。系统具备声音匹配、语音合成与表现力增强功能，并提供多语言支持和完整播客结构生成能力。同时，PodAgent引入评估指标，确保内容的专业性与多样性，适用于媒体、教育、企业推广等多个领域。

AI项目与工具 2025年06月12日 87 点赞 0 评论 718 浏览

Kiss3DGen

Kiss3DGen是一款基于2D扩散模型的3D资产生成框架，通过“3D Bundle Image”结构实现多视角图像与法线图的融合，从而高效生成和编辑3D模型。它支持文本与图像输入，具备3D编辑、网格优化和纹理增强等功能，适用于游戏开发、影视制作、VR/AR、数字孪生及教育等多个领域。

AI项目与工具 2025年06月12日 86 点赞 0 评论 838 浏览

WiseMind AI

WiseMind AI 是一款基于 AI 的学习与知识管理工具，支持多种文档格式，可快速生成摘要、思维导图和智能笔记，提升信息处理效率。平台兼容多个 AI 大模型，提供翻译、海报生成、知识卡片等功能，并采用本地化存储保障数据安全，适用于学术、商务、语言学习等多场景。

AI项目与工具 2025年06月12日 58 点赞 0 评论 663 浏览

NotaGen

NotaGen 是由多所高校联合研发的音乐生成模型，基于预训练、微调和强化学习技术，可生成高质量古典乐谱。支持通过“时期-作曲家-乐器”等条件控制音乐风格，具备高度音乐性与可控性。采用 CLaMP-DPO 方法优化生成质量，无需人工标注。适用于音乐创作、教育、影视配乐等多种场景，提供多种模型规模选择，满足不同需求。

AI项目与工具 2025年06月12日 66 点赞 0 评论 827 浏览

NextGenAI

NextGenAI是由OpenAI发起的全球合作项目，联合多所顶尖高校与机构，推动AI在教育、医疗、科研等领域的应用。该项目提供计算资源与技术支持，助力研究突破、教育革新与知识共享，强化学术与产业合作，促进AI技术的广泛应用与发展。

AI项目与工具 2025年06月12日 83 点赞 0 评论 762 浏览

ART

ART（Anonymous Region Transformer）是一种新型多层透明图像生成技术，支持基于全局文本提示和匿名区域布局生成多个独立透明图层（RGBA格式）。通过逐层区域裁剪机制，显著提升生成效率，速度快于传统方法12倍以上。具备高质量自编码器，支持50层以上的图像生成，减少图层冲突。广泛应用于艺术设计、内容创作、广告营销及科研等领域。

AI项目与工具 2025年06月12日 95 点赞 0 评论 868 浏览

MindLLM

MindLLM是由多所高校联合开发的AI模型，可将功能性磁共振成像（fMRI）信号解码为自然语言文本。其采用主体无关的fMRI编码器与大型语言模型结合，并引入脑指令调优技术，实现跨个体的高精度解码。该模型在多项任务中表现优异，具备广泛的应用潜力，包括医疗康复、脑机接口、神经科学研究及人机交互等领域。

AI项目与工具 2025年06月12日 58 点赞 0 评论 546 浏览

Mochii AI

Mochii AI 是一款多功能AI助手，支持智能对话、文档分析、网页总结、图像识别等功能，兼容多种AI模型。用户可跨平台使用，适用于文档处理、内容创作、代码生成及数据分析等场景，具备个性化定制和上下文理解能力，提升工作效率与体验。

AI项目与工具 2025年06月12日 80 点赞 0 评论 762 浏览

应用

首页

应用

列表

默认

浏览次数

发布日期