admin的文章

DAM

DAM-3B是英伟达开发的多模态大语言模型，专用于图像和视频中特定区域的详细描述。支持点、边界框、涂鸦或掩码等方式指定目标区域，生成精准文本描述。其核心技术包括焦点提示与局部视觉骨干网络，有效融合全局与局部特征。DAM-3B-Video版本扩展至视频处理，适用于动态场景。模型基于Transformer架构，支持多模态输入，广泛应用于内容创作、智能交互及无障碍工具等领域。

896 0

Spinach AI

Spinach AI 是一款智能会议助手，支持自动记录、生成总结及提取关键任务。具备多语言支持与主流工具集成能力，适用于敏捷开发、跨部门协作等多种场景。提供多种订阅模式，保障数据安全，提升会议效率与团队协作水平。

605 0

Cooragent

Cooragent是清华大学LeapLab团队推出的开源AI Agent协作框架，支持通过自然语言快速创建Agent并实现多Agent协同。采用Prompt-Free设计，无需手动编写Prompt，系统自动优化功能。支持本地部署，保障数据安全，兼容Langchain工具链和MCP协议，提供全面API支持，适用于旅行规划、股票分析、文档处理等多种场景。

570 0

A2E

A2E是一款基于AI技术的数字人视频创作平台，支持通过照片、视频或文本生成高度逼真的虚拟形象，具备声音克隆、多语言翻译、视频生成及形象换脸等功能。适用于内容创作、教育、营销等多个领域，帮助用户降低创作门槛，提升内容效率与表现力。

789 0

Open Avatar Chat

Open Avatar Chat是阿里开源的模块化实时数字人对话系统，支持低延迟交互与多模态输入输出。系统采用模块化架构，允许灵活配置语音识别、语言模型和语音合成等组件，兼容本地与云服务。支持2D/3D数字人渲染，适用于客户服务、教育、娱乐及企业应用等多个场景，为开发者提供高效、灵活的AI对话解决方案。

715 0

LongPort MCP

LongPort MCP是长桥集团推出的证券行业首款MCP工具，实现AI与核心金融业务的深度融合。它支持自然语言交互，具备智能投资建议、账户管理、风险监控、交易自动化及量化策略构建等功能。通过标准化API接口和NLP技术，提升金融操作效率，保障数据安全，适用于专业投资者和机构用户。

568 0

MCP万能工具箱

MCP万能工具箱是一个基于MCP开放协议的AI工具集成平台，提供近百款免费工具，覆盖办公、金融、数据处理等场景。支持一键调用多种功能，如财报解析、投资建议、地图导航等，并集成多个主流大模型。用户无需编程即可创建个性化智能体，提升工作效率与决策能力。平台具备安全机制，兼容多系统，适用于办公自动化、金融分析及专业领域支持等多种应用。

735 0

RAGEN

RAGEN是一款开源的强化学习框架，专为在交互式和随机环境中训练大型语言模型（LLM）推理代理而设计。它基于StarPO架构，支持多轮轨迹优化和多种强化学习算法，如PPO和GRPO。通过MDP形式化和渐进式奖励归一化策略，RAGEN提高了训练的稳定性和效率。其模块化设计支持多种环境，适用于智能对话、游戏AI、自动化推理等多个领域。

785 0