DiffSensei DiffSensei是一款由北京大学、上海AI实验室及南洋理工大学联合开发的漫画生成框架,它结合了基于扩散的图像生成技术和多模态大型语言模型(MLLM)。该工具能够根据用户提供的文本提示和角色图像,生成具有高精度和视觉吸引力的黑白漫画面板,支持多角色场景下的互动与布局调整。其核心技术包括掩码交叉注意力机制、对话布局编码以及MLLM作为特征适配器等,广泛应用于漫画创作、个性化内容生成、教育和培训等领 AI项目与工具 2025年06月12日 47 点赞 0 评论 331 浏览
SignGemma SignGemma是由谷歌DeepMind团队开发的全球最强大的手语翻译AI模型,专注于将美国手语(ASL)实时翻译成英语文本。通过多模态训练方法,结合视觉和文本数据,实现高准确率和低延迟的翻译,响应时间低于0.5秒。支持端侧部署,保护用户隐私,适用于教育、医疗和公共服务等场景。 AI项目与工具 2025年06月11日 24 点赞 0 评论 331 浏览
T2I T2I-R1是由香港中文大学与上海AI Lab联合开发的文本到图像生成模型,采用双层推理机制(语义级和 Token 级 CoT),实现高质量图像生成与复杂场景理解。其基于 BiCoT-GRPO 强化学习框架,结合多专家奖励模型,提升生成图像的多样性和稳定性。适用于创意设计、内容制作、教育辅助等多个领域,具有广泛的应用潜力。 AI项目与工具 2025年06月11日 63 点赞 0 评论 330 浏览
OpenAI Academy OpenAI Academy是OpenAI推出的免费AI学习平台,提供多样化的课程和直播活动,涵盖从基础到高级的AI技能。课程内容包括AI教学、科研应用、开发者进阶等,适合教育工作者、学生、技术人员及普通学习者。平台还注重AI在公益和社会服务中的实际应用,致力于推动AI技术的普及与落地。 AI项目与工具 2025年06月12日 95 点赞 0 评论 330 浏览
Ciallo TTS Ciallo TTS是一款开源的文本转语音工具,支持300多种语言和口音,提供语速、语调调节功能,并具备即时试听和长文本处理能力。适用于学习、工作、创作等场景,提升信息获取与内容制作的效率。 AI项目与工具 2025年06月12日 60 点赞 0 评论 330 浏览
ChitChop ChitChop是字节跳动旗下一款基于云雀大语言模型创建的AI集合工具产品,可以为用户提供多达200+的智能机器人服务。 AI服务商 2025年06月05日 86 点赞 0 评论 329 浏览
Notion AI Notion AI 利用大规模的语言模型和数据收集,能帮助用户自动整理笔记、改正错别字、列出文章重点、翻译、制作表格等。 Ai办公效率 2025年06月05日 88 点赞 0 评论 329 浏览
PaintsUndo PaintsUndo是一款AI驱动的绘画过程生成工具,适合数字艺术创作者和绘画爱好者。用户只需提供一张静态图像,PaintsUndo便能自动生成该图像的绘画全过 Ai绘画生成 2025年06月05日 48 点赞 0 评论 328 浏览
k1.5 k1.5 是月之暗面推出的多模态思考模型,具备强大的数学、代码、视觉推理能力。在 short-CoT 模式下,性能超越主流模型 550%,在 long-CoT 模式下达到 OpenAI o1 水平。支持文本与图像的联合处理,适用于复杂推理、跨模态分析、教育、科研等领域。通过长上下文扩展和策略优化,提升推理效率与准确性。 AI项目与工具 2025年06月12日 38 点赞 0 评论 328 浏览
Wonder Animation Wonder Animation是一款基于AI的视频到3D场景转换工具,由Autodesk的Wonder Dynamics研发。它能够将视频序列转化为包含摄像机设置和角色动画的3D动画场景,支持多剪辑和多种镜头处理。通过深度学习和计算机视觉技术,Wonder Animation在3D空间中重建场景,并确保动作和场景的高度同步与一致。此工具特别适合动画电影制作、视频游戏开发、虚拟制作以及增强现实和虚 AI项目与工具 2025年06月12日 43 点赞 0 评论 328 浏览