AI项目与工具

RealisHuman

RealisHuman 是一个用于优化生成图像中人体部位的后处理框架,采用两阶段方法提升手部和面部等部位的真实性。它通过参考原始图像生成逼真结构,并重新绘制周围区域实现无缝融合,支持多种图像风格,适用于游戏、影视、艺术等领域。

Style3D Ai

Style3D AI 是一款面向时尚行业的AI设计与生产工具,支持通过草图、文字或参考图生成可生产的服装款式,具备3D设计、面料替换、自动缝合、BOM生成及智能商拍等功能。平台提供丰富的流行轮廓和资源库,助力企业提高设计效率、缩短生产周期,实现从设计到生产的全流程数字化管理。

XMusic

XMusic是腾讯多媒体实验室开发的AI作曲框架,支持多模态输入(如图片、文字、视频等)生成情绪、风格、节奏可控的高质量音乐。其核心技术包括多模态解析、符号音乐表示与生成优化,具备商用级音乐生成能力。适用于视频配乐、互动娱乐、音乐教育、辅助创作及音乐治疗等多个场景,有效降低音乐创作门槛,提升创作效率与个性化体验。

Arcade

Arcade是一个利用生成式AI技术构建的产品创作平台,允许用户通过文本或图像输入快速生成个性化产品设计。它集成了设计协作、即时生成、定制化生产以及社交分享等功能,并与全球制造商合作确保产品质量。Arcade适用于个人用户及企业,可用于礼品定制、家居装饰、时尚配饰等领域,同时也为教育和商业原型开发提供支持。

Fugatto

Fugatto是一款由英伟达开发的音频合成与转换模型,利用增强型Transformer架构实现了从文本到音频的高效转化。它支持多种音频生成任务,如音乐创作、声音效果设计及语音合成,并可通过ComposableART技术实现对声音属性的精细调控。此外,Fugatto擅长生成动态变化的声音景观,广泛应用于音乐创作、声音设计及广告音频制作等领域。

SuperCraft

SuperCraft是一款基于生成式AI技术的无限协作画布设计平台,能够将手绘草图或文本描述转化为高质量的2D图像和3D渲染。平台提供3D模型导出功能,支持团队协作,具备3D渲染和可视化能力,简化复杂项目的节点式流程设计,旨在提升设计师的工作效率和设计质量。

星火快答

星火快答是科大讯飞推出的AI智能交互系统,集成了虚拟人、语音识别、大数据分析等功能,适用于展厅、会议、营销等场景。支持多模态交互、知识问答、数据可视化与跨屏联动,提升信息传递效率与用户体验。

Cooragent

Cooragent是清华大学LeapLab团队推出的开源AI Agent协作框架,支持通过自然语言快速创建Agent并实现多Agent协同。采用Prompt-Free设计,无需手动编写Prompt,系统自动优化功能。支持本地部署,保障数据安全,兼容Langchain工具链和MCP协议,提供全面API支持,适用于旅行规划、股票分析、文档处理等多种场景。

DynamicFace

DynamicFace是由小红书团队开发的视频换脸技术,结合扩散模型与时间注意力机制,基于3D面部先验知识实现高质量、一致性的换脸效果。通过四种精细的面部条件分解和身份注入模块,确保换脸后的人脸在不同表情和姿态下保持一致性。该技术适用于视频与图像换脸,广泛应用于影视制作、虚拟现实、社交媒体等内容创作领域,具备高分辨率生成能力和良好的时间连贯性。

Khroma

Khroma是一款基于人工智能技术的在线配色平台,允许用户通过输入偏好颜色生成定制化配色方案。它支持多种搜索与筛选功能,能够为设计师提供丰富的色彩灵感,并提供详细的色彩信息。Khroma广泛应用于网页设计、平面设计、UI/UX设计、品牌设计及艺术创作等领域,帮助提升设计效率与质量。