架构 - 智狐AI导航

MeteoRA

MeteoRA是一种基于LoRA和混合专家架构的多任务嵌入框架，用于大型语言模型。它支持多任务适配器集成、自主任务切换、高效推理及复合任务处理，提升模型灵活性和实用性。通过动态门控机制和前向加速策略，显著提高推理效率并降低内存占用，适用于多领域问答、多语言对话等场景。

AI项目与工具 2025年06月12日 72 点赞 0 评论 674 浏览

Mureka Ai

一款AI音乐商用创作平台，Mureka Ai集成了音乐生成、编辑和版权交易功能。

Ai语音工具 2025年06月05日 11 点赞 0 评论 672 浏览

CityDreamer4D

CityDreamer4D是由南洋理工大学S-Lab开发的4D城市生成模型，通过分离动态与静态元素，结合模块化架构生成逼真城市环境。支持无边界扩展、风格化处理、局部编辑及多视角一致性，适用于城市规划、自动驾驶和虚拟现实等领域。采用高效鸟瞰图表示法与神经场技术，提升生成效率与质量。

AI项目与工具 2025年06月12日 55 点赞 0 评论 671 浏览

Seer

Seer是一款由多家科研机构联合开发的端到端机器人操作模型，基于Transformer架构实现视觉预测与动作执行的高度协同。它能够融合多模态信息，具备强大的泛化能力和数据效率，在真实机器人任务中表现优异。Seer适用于工业自动化、服务机器人、医疗健康等多个领域，支持精准动作预测和未来状态预判，显著提升了机器人系统的智能化水平。

AI项目与工具 2025年06月12日 54 点赞 0 评论 670 浏览

FLOAT

FLOAT是一款基于音频驱动的虚拟人像生成模型，利用运动潜在空间和流匹配技术，实现时间一致性视频生成。它支持情感增强，生成自然且富有表现力的虚拟人物，广泛应用于虚拟主播、视频会议、社交媒体、游戏以及电影制作等多个领域，同时具备高效的采样和生成能力。

AI项目与工具 2025年06月12日 18 点赞 0 评论 665 浏览

VideoPoet是一款基于大模型的AI视频生成工具，支持从文本、图像或视频输入中合成高质量的视频内容及匹配的音频。其核心优势在于多模态大模型设计，能够处理和转换不同类型的输入信号，无需特定数据集或扩散模型即可实现多种风格和动作的视频输出。主要功能包括文本到视频转换、图像到视频动画、视频风格化、视频编辑和扩展、视频到音频转换以及多模态学习等。技术原理涉及多模态输入处理、解码器架构、预训练与任务适应

AI项目与工具 2024年01月01日 98 点赞 0 评论 662 浏览

Zamba2

Zamba2-7B是一款由Zyphra公司开发的小型语言模型，具有高效的推理速度和低内存占用的特点。它在图像描述任务中表现出色，适用于边缘设备和消费级GPU。Zamba2-7B通过创新的混合架构和技术优化，提供了卓越的语言理解和生成能力，同时支持多种应用场景，如移动应用开发、智能家居设备、在线客服系统、内容创作以及教育工具等。

AI项目与工具 2025年06月12日 46 点赞 0 评论 662 浏览

Eino

Eino是由字节跳动开源的大模型应用开发框架，采用Go语言构建，具备组件化设计、图编排引擎、流式处理和回调机制等功能，支持高效构建复杂AI应用。其可视化开发工具EinoDev降低了开发门槛，适用于智能客服、知识管理、内容创作等多种场景，具备高扩展性和良好的性能表现。

AI项目与工具 2025年06月12日 56 点赞 0 评论 660 浏览

Imagine Yourself

Imagine Yourself是一款由Meta公司开发的个性化AI图像生成模型，无需针对特定用户进行调整即可生成高质量、多样化的图像。该模型采用了合成配对数据生成和并行注意力架构，提升了图像质量和文本对齐的准确性。主要功能包括无需特定微调、生成合成配对数据、并行注意力架构以及多阶段微调过程。应用场景广泛，包括社交媒体个性化、虚拟试衣间、游戏和虚拟现实、广告和营销以及艺术创作辅助。

AI项目与工具 2025年06月12日 15 点赞 0 评论 656 浏览

TeleChat2

TeleChat2-115B是一款由中国电信人工智能研究院开发的大型语言模型，具备强大的文本生成能力。它支持多语言处理，包括中文和英文，并且能够高效执行多种任务，如文本生成、代码编写、数据分析和语言翻译等。此外，TeleChat2-115B通过先进的架构设计，如Decoder-only结构和Rotary Embedding位置编码方法，提升了模型性能与稳定性。该模型适用于智能客服、内容创作、教育辅

AI项目与工具 2025年06月12日 23 点赞 0 评论 655 浏览

架构

首页

架构

列表

默认

浏览次数

发布日期