AI项目与工具

混元3D v2.5

混元3D v2.5是腾讯推出的高精度3D生成模型,具备超高清建模能力,支持4K纹理和多视图输入,生成更真实的PBR材质模型。其优化的骨骼蒙皮系统提升动画效率,适用于游戏开发、影视制作、电商展示等多个领域,提供多样化的生成模板和参数调节功能,满足专业级3D内容创作需求。

Supademo

Supademo是一款基于AI技术的交互式产品演示平台,支持屏幕录制、AI语音旁白、多语言翻译及个性化编辑。用户可创建高质量、高转化率的演示内容,并通过多渠道分享。平台提供丰富的分析功能,适用于销售、营销、客户支持和产品培训等多个场景。其灵活的定价策略满足不同规模企业的需求。

OneAI

OneAI是一款基于AI大语言模型的智能对话工具,支持多语言交流、信息检索、文本创作、翻译及生活辅助等功能。适用于学习辅导、写作协助、客户服务等多种场景,提供高效、精准的服务,提升用户体验与效率。

Magentic

Magentic-One 是一款由微软开发的通用多智能体系统,通过 Orchestrator 智能体协调 WebSurfer、FileSurfer、Coder 和 ComputerTerminal 等专业智能体,实现复杂任务的跨领域处理。其核心功能包括任务协调与执行、网络信息采集、文件管理、代码编写与执行,以及自适应项目管理。该系统支持模块化设计、模型无关性,并具备强大的自适应特性,广泛应用于企业

Agentic Object Detection

Agentic Object Detection是由吴恩达团队研发的新型目标检测技术,通过智能代理系统实现无需标注数据的目标识别。用户输入文字提示后,AI可精准定位图像中的目标及其属性,支持内在属性、上下文关系及动态状态的识别。该技术无需复杂训练流程,适用于装配验证、作物检测、医疗影像分析、危险物品识别和商品管理等多种场景,显著提升了检测效率和准确性。

Sierra

Sierra 是一款基于对话式 AI 的客户服务解决方案,支持多语言、语音交互和品牌一致性,可实时处理复杂客户问题并优化体验。平台具备强大的适应性和数据分析能力,适用于零售、金融、电信等多个行业,提供高效、个性化的客户支持服务。

Codestral

Codestral是由Mistral AI开发的一款代码生成AI模型,支持超过80种编程语言,具备强大的代码补全、生成、测试和文档生成等功能。该模型拥有220亿参数和32k的上下文窗口,性能优越,适用于软件开发中的多种场景,包括代码编写、测试、重构和文档生成等。支持MNPL许可,主要用于非商业用途的研究和测试。

PixArt

PixArt-Σ是一款基于扩散Transformer架构(DiT)的文本生成图像模型,专为生成高达4K分辨率的高质量图像而设计。该模型通过整合高级元素并采用从弱到强的训练方法,不仅提升了生成图像的保真度,还增强了图像与文本提示之间的对齐效果。PixArt-Σ的生成图像在美学质量上可媲美当前顶级的文本到图像产品,并且在遵循文本提示方面表现出色。主要功能包括4K分辨率图像生成、高保真转换、高效率训练和

Vid2World

Vid2World是由清华大学和重庆大学联合开发的创新框架,能够将全序列、非因果的被动视频扩散模型(VDM)转换为自回归、交互式、动作条件化的世界模型。该模型基于视频扩散因果化和因果动作引导两大核心技术,解决了传统VDM在因果生成和动作条件化方面的不足。Vid2World支持高保真视频生成、动作条件化、自回归生成和因果推理,适用于机器人操作、游戏模拟等复杂环境,具有广泛的应用前景。

TITAN

TITAN是一款由哈佛医学院研究团队开发的多模态全切片病理基础模型,通过视觉自监督学习和视觉-语言对齐预训练,能够在无需微调或临床标签的情况下提取通用切片表示并生成病理报告。它在多种临床任务中表现出色,包括线性探测、少样本和零样本分类、罕见癌症检索、跨模态检索和病理报告生成,尤其适用于资源有限的临床场景。