VideoAgent VideoAgent是一款基于自改进机制的视频生成系统,结合图像观察与语言指令生成机器人控制视频计划。它采用自我条件一致性方法优化视频质量,通过预训练视觉-语言模型反馈和实际执行数据的收集,持续提升生成效果,减少幻觉内容并提高任务成功率。VideoAgent在模拟环境中有优异表现,并已应用于机器人控制、模拟训练、教育研究、游戏开发以及电影制作等领域,展现出广泛的应用潜力。 AI项目与工具 2025年06月12日 66 点赞 0 评论 766 浏览
Psi R0 Psi R0是一款基于强化学习的端到端具身模型,支持双灵巧手协同操作,具备多技能串联混训和跨物品、跨场景的泛化能力。通过仿真数据训练及技能优化,Psi R0能在复杂环境中完成长程任务,同时具备自主切换技能的功能,确保高成功率和鲁棒性。主要应用场景包括电商商品打包、工厂产线组装、服务业拣货打包及家居环境清洁整理。 AI项目与工具 2025年06月12日 18 点赞 0 评论 766 浏览
TouchRetouch TouchRetouch是一款专业的图像编辑软件,专注于去除照片中的多余物体或瑕疵。其核心功能包括对象感知修饰、灵活的线条移除以及智能网格移除,能够高效处理各种复杂的编辑需求。该软件界面友好,操作简便,广泛适用于照片修复、产品摄影、旅行摄影等多个领域。 AI项目与工具 2025年06月12日 20 点赞 0 评论 766 浏览
MedRAG MedRAG是由南洋理工大学研发的医学诊断模型,结合知识图谱与大语言模型(LLM),提升医学诊断的精准度与效率。该模型构建了四层细粒度知识图谱,支持多模态输入,具备主动补问机制,能有效补充患者信息,提升诊断准确性。在真实数据集上,其诊断准确率提升了11.32%。MedRAG可应用于急诊、慢病管理、医学教育等多个领域,为医疗决策提供科学依据。 AI项目与工具 2025年06月12日 79 点赞 0 评论 765 浏览
今天学点啥 “今天学点啥”是一款由秘塔AI开发的AI学习工具,支持用户通过关键词、文档或网页链接生成个性化互动课程,包含PPT和语音讲解。提供多种讲解风格与知识水平适配,具备实时互动、答题挑战和智能推荐功能,适用于学术、职业、兴趣及教育等多种学习场景,提升学习效率与趣味性。 AI项目与工具 2025年06月11日 33 点赞 0 评论 765 浏览
Story.com Story.com 是一款专注于 AI 驱动的故事创作平台,支持用户通过智能生成技术快速创作包含角色、对话和视觉效果的故事内容。平台具备动画加速、社交媒体内容生成、视频初剪等多功能特性,广泛应用于动画制作、社交媒体营销、教育及个人故事分享等领域,帮助创作者提升效率并优化作品质量。 --- AI项目与工具 2025年06月12日 65 点赞 0 评论 765 浏览
ScienceOne ScienceOne是由中国科学院自动化研究所研发的智能科研平台,基于科学基础大模型,支持科研全流程的智能化管理。平台包含S1-Literature文献助手和S1-ToolChain科学工具调度台,分别用于文献综述生成、论文精读辅助及跨学科工具协同调用,提升科研效率与质量。 AI项目与工具 2025年06月11日 100 点赞 0 评论 765 浏览
Recap Recap是一款基于大型语言模型的智能工具,支持文本、网页、PDF和视频等内容的快速总结与分析,提供分段摘要、可视化图表及多语言支持。适用于学术研究、教学、市场分析、内容创作和知识管理等多个场景,提升信息处理效率与理解深度。 AI项目与工具 2025年06月12日 59 点赞 0 评论 765 浏览
AnimateAnything AnimateAnything是一项由浙江大学与北京航空航天大学联合研发的统一可控视频生成技术。它能够根据相机轨迹、文本提示及用户动作注释等多样化控制信号生成高质量视频,并通过多尺度特征融合网络将这些信号转化为逐帧光流进行精准引导。此外,为解决大范围运动带来的视频闪烁问题,该技术采用了基于频率的稳定模块,显著增强了视频的时间稳定性。主要应用于影视制作、虚拟现实、游戏开发以及教育培训等多个领域。 AI项目与工具 2025年06月12日 36 点赞 0 评论 765 浏览
MultiFoley MultiFoley是一款基于多模态控制的音效生成系统,能够根据文本、音频或视频输入生成与视频同步的高质量Foley声音效果。它支持文本驱动和音频驱动的音效生成,同时具备音频扩展和质量控制功能,广泛应用于电影、游戏、动画及虚拟现实等领域,为用户提供灵活且高效的声音设计解决方案。 AI项目与工具 2025年06月12日 78 点赞 0 评论 765 浏览