EasyControl EasyControl是基于扩散变换器(DiT)架构的高效控制框架,采用轻量级LoRA模块实现多条件控制,支持图像生成、风格转换、动画制作等任务。其具备位置感知训练范式和因果注意力机制,优化计算效率,提升生成质量与灵活性,适用于多种图像处理场景。 AI项目与工具 2025年06月12日 48 点赞 0 评论 485 浏览
WebSSL WebSSL是由Meta和纽约大学等机构开发的视觉自监督学习模型,基于大规模网络图像数据训练,无需语言监督即可学习有效视觉表示。其包含多个变体,参数规模从3亿到70亿不等,在多模态任务如视觉问答、OCR和图表理解中表现出色。通过筛选含文本图像数据,显著提升特定任务性能。模型具备良好的扩展性,适用于智能客服、文档处理、医疗影像分析等多个领域。 AI项目与工具 2025年06月11日 92 点赞 0 评论 487 浏览
Astria AI Astria是一个利用生成AI创建定制图像的平台。Astria AI允许用户上传一组主题的图像,然后根据文本提示生成新图像。 Ai绘画生成 2025年06月05日 28 点赞 0 评论 488 浏览
Optimus Optimus-1是一款由哈尔滨工业大学(深圳)和鹏城实验室联合开发的智能体框架,专为开放世界环境中的长期任务设计。它结合结构化知识与多模态经验,通过混合多模态记忆模块(HDKG与AMEP)提升任务规划与执行能力。主要功能包括知识引导规划、经验驱动反思、行动控制及自我进化,已在游戏、虚拟助理、工业自动化等领域得到验证。 AI项目与工具 2025年06月12日 98 点赞 0 评论 489 浏览
FlexiAct FlexiAct是由清华大学与腾讯ARC实验室联合研发的动作迁移模型,可在空间结构差异较大的场景下实现精准动作迁移,并保持目标主体的外观一致性。其核心模块包括轻量级RefAdapter和频率感知动作提取(FAE),有效提升跨主体动作迁移的灵活性与准确性。该模型适用于影视、游戏、广告等多个领域,具有良好的应用前景。 AI项目与工具 2025年06月11日 39 点赞 0 评论 490 浏览
GPT学术优化 GPT学术优化是一款专为学术研究与写作设计的开源工具,提供论文翻译、代码解析、信息提取、LaTeX校对、论文润色及摘要生成等功能。其模块化设计支持灵活扩展,通过大型语言模型实现高效的语言处理任务,适用于学术研究、教育辅导、项目开发和技术文档撰写等多个场景。 AI项目与工具 2025年06月12日 58 点赞 0 评论 490 浏览
Topaz Video AI 4 一家为专业人士提供基于人工智能的照片和视频增强软件的公司。他们的软件利用深度学习来提高图像质量,包括降噪、锐化、提升分辨率等功能。 Ai视频生成 2025年06月05日 49 点赞 0 评论 494 浏览
Gemini Robotics Gemini Robotics 是谷歌 DeepMind 基于 Gemini 2.0 开发的机器人系统,融合视觉-语言-动作模型,支持复杂任务执行与环境适应。具备三维空间理解、物体检测、轨迹预测和开放词汇指令执行能力,适用于工业制造、物流仓储、家庭服务、医疗健康等多个领域。系统通过数据驱动训练,结合真实操作与多模态信息,实现高效、灵活的机器人控制。 AI项目与工具 2025年06月12日 17 点赞 0 评论 496 浏览
URM URM是由阿里妈妈开发的通用推荐模型,结合大语言模型与电商领域知识,提升推荐效果。其采用多模态融合与Sequence-In-Set-Out生成方式,支持多场景、多目标、长尾及发现性推荐。具备高效率、零样本学习能力,适用于工业级推荐系统,已应用于阿里妈妈展示广告场景,优化用户体验与商家投放效果。 AI项目与工具 2025年06月11日 85 点赞 0 评论 496 浏览