Video Diffusion Models Video Diffusion Models项目展示了扩散模型在视频生成领域的潜力,通过创新的梯度条件方法和自回归扩展技术,生成了具有高度时间连贯性和质量的视频样本。 Ai绘画生成 1970年01月01日 0 点赞 0 评论 345 浏览
理想同学网页版 理想同学网页版是一款由理想汽车推出的AI智能助手,集成DeepSeek R1/V3 671B满血版模型,支持多模型切换、联网搜索、图像识别等功能。用户可通过文字、长文本或图片进行交互,支持360°视觉追踪,提升交互体验。适用于办公、学习、多设备协同等场景,支持网页与移动端同步,打造无缝智能服务生态。 AI项目与工具 2025年06月12日 44 点赞 0 评论 343 浏览
SVFR SVFR是一款由腾讯优图实验室与厦门大学联合开发的视频人脸修复框架,能够统一处理视频中的人脸修复、着色和缺失区域补全任务。基于Stable Video Diffusion模型,结合任务嵌入、统一潜在正则化等技术,提升修复精度与时间稳定性。适用于影视后期、网络视频制作及数字档案修复等领域,具有广泛的应用价值。 AI项目与工具 2025年06月12日 81 点赞 0 评论 342 浏览
PlanGEN PlanGEN 是谷歌研发的多智能体协作框架,用于解决复杂问题的规划与推理。它包含约束、验证和选择三大智能体,支持多智能体协作、约束引导、算法自适应选择等功能。提供四种实现方式,适用于不同复杂度任务,如日程安排、数学证明、自动驾驶等。具有模型不可知性,可与多种大语言模型结合,具备良好的可扩展性和灵活性。 AI项目与工具 2025年06月12日 35 点赞 0 评论 340 浏览
Wan2.1 Wan2.1是阿里云推出的开源AI视频生成模型,支持文生视频与图生视频,具备复杂运动生成和物理模拟能力。采用因果3D VAE与视频Diffusion Transformer架构,性能卓越,尤其在Vbench评测中表现领先。提供专业版与极速版,适应不同场景需求,已开源并支持多种框架,便于开发与研究。 AI项目与工具 2025年06月12日 47 点赞 0 评论 333 浏览
PaddleSpeech PaddleSpeech是百度飞桨团队开发的开源语音处理工具,涵盖语音识别、语音合成、声纹识别、语音翻译等功能。支持多种接口形式,适用于智能语音助手、语音播报、身份验证等场景。基于PaddlePaddle框架,提供高效的深度学习模型和丰富的音频处理能力,适用于多种实际应用需求。 AI项目与工具 2025年06月12日 87 点赞 0 评论 333 浏览
塔猫AI对话PPT 塔猫AI对话PPT是一款利用深度学习与自然语言处理技术的智能PPT分析工具,可解析文本、图表等内容,支持智能问答、摘要生成及逻辑优化建议等功能。它适用于信息检索、演讲准备、教育培训等多个场景,助力用户高效获取所需信息。 AI项目与工具 2025年06月12日 98 点赞 0 评论 330 浏览
书生·筑梦2.0(Vchitect 2.0) 书生·筑梦2.0是一款由上海人工智能实验室开发的开源视频生成大模型,支持文本到视频和图像到视频的转换,生成高质量的2K分辨率视频内容。它具备灵活的宽高比选择、强大的超分辨率处理能力以及创新的视频评测框架,适用于广告、教育、影视等多个领域。 AI项目与工具 2025年06月12日 32 点赞 0 评论 329 浏览
MobileLLM MobileLLM是一款针对移动设备优化的大型语言模型,具有语言理解与生成、零样本常识推理、聊天交互、API调用、文本重写与摘要生成以及数学问题解决等功能。它通过深度薄型架构、SwiGLU激活函数、嵌入共享和分组查询注意力机制等技术,在低参数环境下实现高效性能,适用于移动聊天、语音助手、内容推荐、教育辅助和移动搜索等多种应用场景。 AI项目与工具 2025年06月12日 52 点赞 0 评论 329 浏览