AI

MHA2MLA

MHA2MLA是一种由多所高校与研究机构联合开发的数据高效微调方法,基于多头潜在注意力机制(MLA)优化Transformer模型的推理效率。通过Partial-RoPE和低秩近似技术,显著减少KV缓存内存占用,同时保持模型性能稳定。仅需少量数据即可完成微调,适用于边缘设备、长文本处理及模型迁移等场景,具备高兼容性和低资源消耗优势。

GaussianAnything

GaussianAnything 是一款基于多模态输入的 3D 内容生成框架,支持点云、文本和图像等多种输入方式,能够生成高精度且可编辑的 3D 模型。其核心技术包括点云结构化潜空间和级联扩散模型,具备几何与纹理解耦特性,适用于游戏开发、影视制作、VR/AR、工业设计等多个场景。该工具在生成质量和一致性方面表现优异,为 3D 内容创作提供了高效解决方案。

VACE

VACE是由阿里巴巴通义实验室推出的视频生成与编辑框架,支持文本到视频、参考生成、视频扩展、遮罩编辑等多种任务。其核心是Video Condition Unit(VCU),可整合多模态输入,实现任务灵活组合。支持480P和720P分辨率,适用于创意视频制作、视频修复、风格转换及互动创作等场景,具备高灵活性和广泛的应用潜力。

Seedream 2.0

Seedream 2.0 是字节跳动豆包团队推出的中英双语图像生成模型,具备强大的文本理解和渲染能力,可生成具有文化细节和美学表达的高质量图像。支持多分辨率生成、字符级文本处理,并通过强化学习优化性能,适用于海报设计、社交媒体、绘画创作等多领域应用。

PP

PP-DocBee是百度飞桨推出的多模态文档理解模型,基于ViT+MLP+LLM架构,支持文字、表格、图表等多类型文档内容的精准识别与解析。具备高效的推理性能和高质量输出,适用于文档问答、信息提取等场景,支持灵活部署,为文档处理提供智能化解决方案。

MM

MM-StoryAgent是由上海交通大学X-LANCE实验室与阿里巴巴集团联合开发的开源多模态、多智能体框架,用于生成沉浸式有声故事绘本视频。它结合大型语言模型与多模态生成技术,通过多阶段写作流程和模态对齐优化,提升故事内容的质量与连贯性。支持灵活模块化设计,适用于儿童教育、数字内容创作、在线教育等多个场景,为故事创作提供高效、可定制的解决方案。

Docwelo

Docwelo 是一款面向自由职业者和中小企业用户的 AI 文档生成工具,可快速生成法律合同、业务提案等专业文档。平台具备银行级安全保护,支持多人实时协作,并提供可定制的工作流程,提升文档创建效率与准确性。

Quadratic

Quadratic是一款基于AI技术的电子表格工具,支持自然语言交互、智能图表生成、数据库查询优化及代码执行。它提供高效的数据处理能力,适用于数据分析、可视化及团队协作等场景,拥有免费版、专业版和企业定制版,满足不同用户需求。

Deep Research Web UI

Deep Research Web UI 是一款开源 AI 研究助手,支持多轮次搜索、树状可视化研究路径、多语言处理及数据导出功能。具备智能搜索、数据分析、报告生成能力,适用于文献综述、市场调研等场景。工具可在浏览器端运行,保障隐私安全,并兼容多种 AI 模型,支持本地部署与自定义配置。

SimplifyAI

SimplifyAI 是一款支持多格式文档翻译的 AI 工具,可保持原文排版并提供术语管理、实时翻译及语言优化功能。适用于学术研究、商业文件处理、跨境电商、教育和个人学习等多种场景,确保翻译准确、高效且安全。