FancyTech 一家专注于人工智能内容生成的公司,提供创新的AI平台,能够将产品图片转换成吸引人的、具有传播性的视频,从而将静态的视觉内容转变为动态且富有吸引力的形式。 电商运营 2025年06月05日 25 点赞 0 评论 649 浏览
万相首尾帧模型 万相首尾帧模型(Wan2.1-FLF2V-14B)是一款开源视频生成工具,基于DiT架构和交叉注意力机制,可根据用户提供的首帧和尾帧图像生成高质量、流畅的过渡视频。支持多种风格和特效,适用于创意视频制作、影视特效、广告营销等多个场景。模型具备细节复刻、动作自然、指令控制等功能,且提供GitHub和HuggingFace开源资源供用户使用。 AI项目与工具 2025年06月11日 100 点赞 0 评论 649 浏览
Autocut AutoCut是一款开源AI视频剪辑工具,利用自动语音识别技术生成字幕并支持文本编辑功能,帮助用户高效剪辑视频片段。支持多模型运行及硬件加速,可输出SRT或Markdown格式文件,广泛应用于视频创作、企业培训、新闻报道、语言学习等多个领域。 AI项目与工具 2025年06月12日 69 点赞 0 评论 649 浏览
星流图像大模型 星流图像大模型是由LiblibAI发布的一款自研图像大模型,名为Star-3 Alpha。由LiblibAl团队于2024年启动研发,将于2025年Q1发布正式 Ai绘画生成 2025年06月05日 62 点赞 0 评论 650 浏览
Merlin AI 一个基于OpenAI的ChatGPT技术的浏览器扩展,Merlin AI能够在用户的浏览器上提供一键访问ChatGPT、GPT-4、Claude和Llama等高级语言模型的功能。 AI写作对话 2025年06月05日 82 点赞 0 评论 650 浏览
云合AI 基于百度文心4.0大模型,以及自身在产业服务领域深耕10年沉淀、打磨出的产业大数据,为产业办公人群提供专精学习、全球产业新闻、资讯以及办公提速工具。 AI服务商 2025年06月05日 22 点赞 0 评论 650 浏览
OSUM OSUM是一款由西北工业大学研发的开源语音理解模型,结合Whisper编码器与Qwen2 LLM,支持语音识别、情感分析、说话者性别分类等多种任务。采用“ASR+X”多任务训练策略,提升模型泛化能力和稳定性。基于约5万小时语音数据训练,性能优异,适用于智能客服、教育、心理健康监测等多个领域。 AI项目与工具 2025年06月12日 46 点赞 0 评论 650 浏览
MagicQuill MagicQuill是一款基于AI的开源图像编辑工具,提供智能化的局部编辑功能。其核心功能包括AI驱动的智能建议、精确的像素级编辑(如添加、删除和颜色调整),以及多种定制化工具(如添加笔刷、减去笔刷和颜色笔刷)。此外,它还具备实时意图预测和参数调整能力,支持多模态大语言模型和扩散模型的协作,适用于个人娱乐、教育、专业设计及商业应用等多个领域。 AI项目与工具 2025年06月12日 85 点赞 0 评论 650 浏览
Champ Champ是由阿里巴巴、复旦大学和南京大学的研究人员共同开发的一款基于3D的AI工具,能够将人物图片转换为高质量的视频动画。Champ通过结合3D参数化模型和潜在扩散模型,精准捕捉和再现人体的3D形态和动态,保证动画的连贯性和视觉逼真度。此外,Champ还支持跨身份动画生成,并能与文本生成图像模型结合,使用户可以根据文本描述生成特定的角色外观和动作。 AI项目与工具 2024年01月01日 81 点赞 0 评论 650 浏览