Deep Art Effects Deep Art Effects 是一款利用深度学习技术的在线工具,能够将普通照片转换为具备多种艺术风格(如梵高、毕加索等)的作品。其主要功能包括艺术风格转换、高分辨率输出、丰富的艺术风格库以及 API 集成支持。该工具适用于个人娱乐、艺术创作、教育、广告及社交媒体内容创作等多个领域。 AI项目与工具 2025年06月12日 56 点赞 0 评论 280 浏览
SwiftAgent 2.0 SwiftAgent 2.0 是一款依托于大模型与 AI Agent 技术的企业级数据分析工具,旨在帮助企业实现从数据到决策的智能化升级。其主要特点包括统一语义层构建、多源数据集成、实时交互体验以及持续学习优化机制,广泛应用于业务决策支持、销售预测、客户洞察及财务规划等多个领域。 AI项目与工具 2025年06月12日 60 点赞 0 评论 280 浏览
Sitcom Sitcom-Crafter是一款由多所高校联合开发的3D场景人类动作生成系统,能够根据剧情描述生成多样化、符合物理规律的动作,包括行走、交互及多人协作。系统具备八大模块,包含核心动作生成与增强功能,如碰撞修正、运动同步与手部姿态检索。其核心技术包括3D场景感知与自监督SDF策略,无需额外数据即可生成自然动作。适用于动画、游戏、VR/AR、影视及教育等多个领域,提升创作效率与智能化水平。 AI项目与工具 2025年06月12日 48 点赞 0 评论 280 浏览
Eagle 2.5 Eagle 2.5 是一款由英伟达开发的视觉语言模型,专注于长上下文多模态学习,具备处理高分辨率图像和长视频序列的能力。其参数规模为 8B,但性能接近更大模型。采用信息优先采样和渐进式后训练策略,提升模型稳定性与适应性。支持多样任务,适用于视频分析、图像处理、内容创作及教育等多个领域。 AI项目与工具 2025年06月11日 59 点赞 0 评论 280 浏览
Proactive Agent Proactive Agent是一款由清华大学主导开发的主动式AI代理系统,它通过观察环境和用户行为来预测需求并自主发起任务,无需依赖明确指令即可完成操作。主要功能包括环境感知、上下文理解、任务执行及用户互动优化等。此外,该系统采用先进的环境模拟技术和奖励机制进行训练与评估,广泛应用于个人助理、文件管理、生活服务等多个领域。 AI项目与工具 2025年06月12日 86 点赞 0 评论 280 浏览
ModelEngine ModelEngine 是华为开源的全流程 AI 开发工具链,涵盖数据处理、模型训练与应用开发三大核心模块。支持多模态数据清洗、知识向量化及模型推理,提供低代码编排和 RAG 框架,适用于医疗、金融、制造等领域的 AI 应用开发与行业化落地。 AI项目与工具 2025年06月12日 75 点赞 0 评论 280 浏览
T2A T2A-01-HD是一款支持声音克隆与多语言合成的AI语音模型,可精准还原原声特征与情感表达。具备智能情感系统、多语言支持及高级参数控制功能,适用于有声读物、影视配音、教育、语言学习等多种场景,提供高质量、个性化的语音输出。 AI项目与工具 2025年06月12日 46 点赞 0 评论 280 浏览
DrivingDojo DrivingDojo是一个由中国科学院自动化研究所与美团无人车团队合作研发的数据集,包含18,000个视频片段,涵盖全面的驾驶操作、多智能体交互及开放世界驾驶知识。它定义了动作指令跟随(AIF)基准,用于评估世界模型的预测能力,并支持自动驾驶算法开发、世界模型训练、多智能体交互模拟及罕见事件处理等多个应用场景。 AI项目与工具 2025年06月12日 85 点赞 0 评论 280 浏览
OmniBooth OmniBooth是一款由华为诺亚方舟实验室与香港科技大学联合开发的图像生成框架,支持基于文本或图像的多模态指令控制及实例级定制。它通过高维潜在控制信号实现对图像中对象位置和属性的精准操控,具备多模态嵌入提取、空间变形技术以及特征对齐网络等功能,广泛应用于数据集生成、内容创作、游戏开发、虚拟现实及广告营销等领域。 AI项目与工具 2025年06月12日 46 点赞 0 评论 281 浏览
RAG RAG-Diffusion是一种区域感知型文本到图像生成工具,采用区域硬绑定与区域软细化两阶段策略,实现对图像区域的精确控制与细节优化。该工具支持图像重绘,无需额外内绘模型,且具备免微调特性。其主要应用场景包括数字艺术创作、广告设计、游戏开发及影视制作等领域,能够显著提升工作效率并满足个性化需求。 AI项目与工具 2025年06月12日 48 点赞 0 评论 281 浏览