MagicTryOn MagicTryOn是由浙江大学和vivo等机构开发的视频虚拟试穿框架,采用扩散Transformer(DiT)架构替代传统U-Net,结合全自注意力机制实现视频时空一致性建模。通过粗到细的服装保持策略,整合服装标记与多条件引导,有效保留服装细节。该工具在图像和视频试穿任务中表现优异,适用于在线购物、时尚设计、虚拟试衣间等多种场景。 AI项目与工具 2025年06月11日 81 点赞 0 评论 211 浏览
Kimi Kimi-VL是月之暗面推出的轻量级多模态视觉语言模型,支持图像、视频、文档等多种输入形式。其基于轻量级MoE架构和原生分辨率视觉编码器,具备强大的图像感知、数学推理和OCR能力。在长上下文(128K)和复杂任务中表现优异,尤其在多模态推理和长视频理解方面超越同类模型。适用于智能客服、教育、医疗、内容创作等多个领域。 AI项目与工具 2025年06月11日 30 点赞 0 评论 210 浏览
Aero Aero-1-Audio 是一款基于 Qwen-2.5-1.5B 的轻量级音频模型,拥有 1.5 亿参数,专注于长音频处理,支持连续 15 分钟音频输入并保持上下文连贯性。在语音识别、复杂音频分析及指令驱动任务中表现出色,具备高效的训练方法和多任务处理能力,适用于语音助手、实时转写、归档理解等场景。 AI项目与工具 2025年06月11日 43 点赞 0 评论 210 浏览
德克萨斯大学奥斯汀分校 德克萨斯大学奥斯汀分校(University of Texas at Austin,简称:UT-Austin)创建于1883年,是得克萨斯大学系统的旗舰校区,位于美国德克萨斯州首府奥斯汀市,是一所顶尖公立研究型... 教育学习 1970年01月01日 0 点赞 0 评论 210 浏览
即刻创作 一个免费在线AI图文创作平台,提供强大丰富的图文AI创作能力 , Xdraw图文编辑器、图片格式转换、自由裁剪等多种免费功能 ,快速创作您的作品。 AI写作对话 2025年06月05日 27 点赞 0 评论 210 浏览
WebPilot.Ai 一款可以与网页进行自由对话的免费开源的AI工具,具有网页内容的智能问答和总结功能,用户可以从输入的网站中获取网站页面的信息。 AI搜索问答 2025年06月05日 14 点赞 0 评论 210 浏览
Versatile Versatile-OCR-Program是一款开源多模态OCR工具,支持从教育材料中提取文本、公式、表格等结构化数据,输出为JSON或Markdown格式,准确率高达90%-95%。它基于DocLayout-YOLO、Google Vision和MathPix等技术,支持多语言处理,适用于教育数据集制作、教学辅助、AI模型训练及个人学习等场景。 AI项目与工具 2025年06月11日 77 点赞 0 评论 209 浏览
Objaverse Objaverse 是一个为3D领域提供巨大资源的数据库,它不仅支持 AI 模型的训练和3D内容的生成,还与流行的3D编辑软件 Blender 兼容。 创作工具 1970年01月01日 0 点赞 0 评论 208 浏览