R

Large Motion Model

Large Motion Model(LMM)是一款由新加坡南洋理工大学S-Lab和商汤科技合作研发的多模态运动生成框架。它支持从文本、音乐等多种模态生成逼真运动序列,具备高度精准的身体部位控制能力和强大的泛化能力。通过整合多样化的MotionVerse数据集以及创新性的ArtAttention机制和预训练策略,LMM在多个领域展现出高效的应用潜力,包括动画、虚拟现实、影视特效及运动分析等。

PaddleOCR 2.9

PaddleOCR 2.9 是一个基于深度学习的开源 OCR 工具库,提供了强大的文本识别、版面分析和信息抽取功能。支持多语言识别和多种硬件平台,通过低代码开发模式简化了模型的部署和定制,广泛应用于文档数字化、智能办公、身份验证、物流管理和金融服务等领域。

Surya

Surya是一款开源OCR工具包,专注于文档识别,支持90多种语言的文本提取与分析。它能够识别文档中的文本、表格、图片及标题等布局元素,并确保文本阅读顺序的准确性。凭借其高效的表格识别能力和优化的算法,Surya在处理复杂文档时表现出色,广泛应用于文档数字化、数据提取、多语言处理以及学术研究等领域。 ---

Search

Search-o1是由中国人民大学和清华大学联合开发的AI工具,旨在提升大型推理模型在复杂任务中的表现。其核心在于结合RAG机制与Reason-in-Documents模块,实现动态知识检索与精炼处理,增强推理的准确性和连贯性。该工具在科研、数学、编程、问答等多个领域展现出广泛适用性,为构建更可靠的智能系统提供了新路径。

PhotoKit图片编辑器

PhotoKit,基于AI人工智能的在线图片编辑器,方便易用。您可以通过编辑器一键抠图、改图、修图、美图等。

OfficeAI助手

OfficeAI助手是一款面向Microsoft Office和WPS用户的智能办公工具,集成WordAI和ExcelAI插件,提供文档撰写、数据分析、格式优化等功能。支持AI对话、智能校对、自动排版、公式推荐、图表生成等,提升办公效率。具备本地部署、多语言支持与跨平台兼容性,适用于各类办公场景。

Mermaid Chart

一个应用于协作式文本图表的平台,它利用人工智能生成复杂思想的可视化图表。

AgentUniverse

一个面向复杂业务场景设计的多智能体协作框架,它提供了快速易用的大模型智能体应用搭建能力,以及丰富的多智能体协同模式组件。

OmniConsistency

OmniConsistency 是新加坡国立大学推出的图像风格迁移模型,旨在解决复杂场景下风格化图像的一致性问题。该模型采用两阶段训练策略,将风格学习与一致性学习解耦,并支持与任意风格的 LoRA 模块集成,实现高效且灵活的风格化效果。它在多种风格下保持图像的语义、结构和细节一致性,具备更高的灵活性和泛化能力,在实验中表现出与 GPT-4o 相当的性能。

Dubverse AI

Dubverse.ai 是一个使用人工智能 (AI)让您轻松快速地将视频中说话者的声音更改为另一种语言的网站。