深度学习

日日新融合大模型

日日新融合大模型(SenseNova)是商汤科技推出的多模态AI系统,支持文本、图像、视频等多种数据的融合处理,具备强大的深度推理与多模态分析能力。该模型在多个权威评测中表现优异,广泛应用于自动驾驶、视频交互、办公教育、金融、园区管理及工业制造等领域,提升了多场景下的智能化水平。

clone

Clone-Voice是一款基于深度学习的声音克隆工具,支持16种语言的文本转语音及声音风格转换,具有友好的操作界面和较低的硬件要求。它被广泛应用于视频制作、语言学习、有声出版物创作、广告宣传及游戏开发等领域,为用户提供多样化的个性化声音解决方案。

VisoMaster

VisoMaster 是一款基于 AI 的面部编辑与换脸工具,支持图片、视频及直播场景,能生成自然逼真的换脸效果。采用 GPU 加速与自定义模型功能,适用于影视、广告、视频创作等领域。核心技术包括深度学习与 GANs,实现高精度面部特征提取与图像合成,支持实时预览与参数调整,提升用户体验与效率。

HealthGPT

HealthGPT是由多家高校与企业联合开发的医学视觉语言模型,支持医学图像分析、视觉问答、文本生成及多模态融合等任务。其核心技术包括异构低秩适应(H-LoRA)、分层视觉感知(HVP)和三阶段学习策略(TLS),可高效处理复杂医疗数据。模型适用于医学诊断、教育、研究及健康管理等多个场景,具有良好的适应性和实用性。

Plask

​Plask,一种基于 Web 的 AI 解决方案,用于生成 生成具有定制姿势和角度的3D 图像。 而无需花费数小时在绘图、摆姿势和渲染上。

微软VASA

微软亚洲研究院开发的一种前沿人工智能技术,VASA-1能够将单一静态图像和一段语音音频转换成逼真的对话面部动画。

Finedefics

Finedefics是由北京大学彭宇新教授团队开发的细粒度多模态大模型,专注于提升多模态大语言模型在细粒度视觉识别任务中的表现。该模型通过引入对象的细粒度属性描述,结合对比学习方法,实现视觉对象与类别名称的精准对齐。在多个权威数据集上表现出色,准确率达76.84%。其应用场景涵盖生物多样性监测、智能交通、零售管理及工业检测等领域。

文心大模型X1

文心大模型X1是百度开发的深度思考型AI模型,具备中文知识问答、逻辑推理、文学创作等能力,支持多模态内容生成与工具调用。采用递进式强化学习与端到端训练技术,结合飞桨平台实现高效推理。适用于文学创作、文案生成、学术研究、代码开发等多个领域,提供高性价比的AI服务。

DAMODEL

DAMODEL是一个基于GPU算力的AI开发云平台,支持多种主流AI框架和高性能GPU配置,提供开箱即用的开发环境和便捷的数据管理功能。平台具备可视化操作界面、JupyterLab在线访问及多种预置模型,适用于大模型训练、深度学习、数据科学和图像处理等多种应用场景。

Surya

Surya是一款开源OCR工具包,专注于文档识别,支持90多种语言的文本提取与分析。它能够识别文档中的文本、表格、图片及标题等布局元素,并确保文本阅读顺序的准确性。凭借其高效的表格识别能力和优化的算法,Surya在处理复杂文档时表现出色,广泛应用于文档数字化、数据提取、多语言处理以及学术研究等领域。 ---