架构 - 智狐AI导航

程序员盒子CoderUtil

一个程序员的高效工具网址导航网站，程序员盒子网提供自定义快捷网址导航，涵盖技术社区、学习平台、资源推荐等多种功能，目前拥有超过200万的程序员用户群体。

独立开发 2025年06月05日 88 点赞 0 评论 725 浏览

Janus

Janus是一种由DeepSeek AI开发的自回归框架，专注于多模态理解和生成任务的统一化。它通过分离视觉编码路径并使用单一Transformer架构来提升灵活性和性能，支持多种输入模态如图像、文本等，并在某些任务中表现出色。Janus具备多模态理解、图像生成及跨模态交互能力，适用于图像创作、自动标注、视觉问答等多个领域。

AI项目与工具 2025年06月12日 45 点赞 0 评论 725 浏览

HMA

HMA（Heterogeneous Masked Autoregression）是一种基于异构预训练和掩码自回归技术的机器人动作视频建模方法，支持离散与连续生成模式，可处理不同动作空间的异构性。该工具具备高效实时交互能力，广泛应用于视频模拟、策略评估、合成数据生成及模仿学习等领域，适用于机器人学习与控制任务，提升策略泛化与执行效率。

AI项目与工具 2025年06月12日 22 点赞 0 评论 727 浏览

豆包大模型1.5

豆包大模型1.5是字节跳动推出的高性能AI模型，采用大规模稀疏MoE架构，具备卓越的综合性能和多模态能力。支持文本、语音、图像等多种输入输出方式，适用于智能辅导、情感分析、文本与视频生成等场景。模型训练数据完全自主，性能优于GPT-4o和Claude 3.5 Sonnet等主流模型，且具备成本优势。

AI项目与工具 2025年06月12日 23 点赞 0 评论 728 浏览

MCP

MCP（Model Context Protocol）是一项由Anthropic开源的协议，专注于实现大型语言模型（LLM）与外部数据源和工具的无缝集成。其核心功能包括数据集成、工具集成、模板化交互、安全性、开发者支持及上下文维护，支持双向数据流并内置安全机制。MCP适用于AI驱动的集成开发环境、增强聊天界面、自定义AI工作流、ERP系统集成及CRM系统增强等场景。

AI项目与工具 2025年06月12日 59 点赞 0 评论 729 浏览

InternVL

InternVL是由上海人工智能实验室开发的多模态大模型，融合视觉与语言处理能力，支持图像、视频、文本等多种输入。其基于ViT-MLP-LLM架构，具备多模态理解、多语言处理、文档解析、科学推理等能力，广泛应用于视觉问答、智能客服、图像分析等领域。模型采用动态高分辨率与渐进式训练策略，提升处理效率与准确性。

AI项目与工具 2025年06月12日 78 点赞 0 评论 733 浏览